서울·교은독 교수가 지적하고 며칠 전에 기사화된 김치용 배추 구글 번역기의 결과. 사실은 유튜브하면서 매번 번역해서 올린 입장에서 특히 요리 부분은 특히 신경을 쓰고 있기 때문에 구글 번역기와 네이버 아빠고를 같이 돌려서 검색 결과를 보고 적당하지 않는지 정확하지 않으면 구글 검색하고 그 나라의 표현까지 모두 확인합니다.최근 들어 훨씬 x 두드리는 구글 번역이 많았다.3년 전까지는 구글 번역이 네이버 아빠고보다는 낫이었지만 솔직히 지금은 네이버 아빠고가 훨씬 좋다.적어도 한글에서 영어 번역본은!파파고은 번역 참여 행사를 하면서 번역 quality피드백이 이어져반면 구글은 다양한 채널에서 들어온 데이터에 떠넘기고 피드백도 잘 안 된 듯하다.초반만 번역 참여로 요청하면 개선될 것 같지만 요즘은 전혀···단, 튜브 에러가 발생하고 문제가 있을 때는 빨리 해결된다.에러에 따라서도 달라지지만.community expert(구글 직원인지는 알 수 없다)이 있고, 국가별에 에러가 함께 나오면 빨리 해결할 것이다.
구글 번역기에 김장용 배추를 넣었더니 충격적인 결과가 나온 구글 번역기에서 현재 김치용 배추를 검색하면 Chinesecabbage for Kimchi(김치를 위한 중국 배추)로 결과가 나오는 데 대해 서경덕 교수는 4일 배추의 영문 표기부터 바꿔 나가야 한다고 주장했다.서 교수는 이날 소셜미디어(SNS)에서 www.mk.co.kr
그런데 이 논란의 김치 배추 구글 번역 오류는 변경됐나 싶어 찾아보니 여전하다.B, 글로벌 Top1 플랫폼이다.구글 번역기 김치용 배추 → Chinesecabbage for kimchi
파파고 김치용 배추 → cabbage for kimchi
그래서 김장을 번역해 보았다.그냥 놔둔 것처럼.구글 번역기 김장→Kimchi
파파고 김장 -> Making Kimchi김치만 그런가?된장은?한국 요리에 김치와 된장을 거르고 할까?실은 저번에 유튜브에 업로드하는 영상 때문에 번역을 하고 있지만 구글 번역기에 된장 국이 된장 국?이상했네.미역 된장 국을 번역기에 걸어 보자.구글만이 아니고 파파고까지.물론 된장 국에 미역을 넣어 끓이는 게 있기 때문이지만, 그 번역은 Miso soup이다.물론 결국 미역 된장 국은 Seaweed Soybean Paste Soup에 번역해서 준다.구글 미역 된장 국->Seaweed miso soup파파고 미역된장국 -> Seaweed miso soup그래서 된장국으로 번역해볼게.그냥 구글은 된장국은 Miso Soup 같아.구글 미소시루→Miso Soup파파고 된장국 -> Soybean Paste Soup그래서 봄동 된장국을 번역해 보았다.춘동된장국 봄동을 모를지 모르지만 된장국 번역을 볼 수 있으니까 그런데 구글은 그냥 된장국은 무조건 miso soup 같다.결국 봄동 된장국은 일단 이 번역으로 나온다.Soybean Paste Soup with Fresh Winter Cabbage (Bomdong Doenjangguk)구글봄동된장국 -> Bom-dong miso soup파파고 춘동 된장국 -> Spring bean paste soup그럼 된장은? 구글은 그냥 된장은 Miso 같아.구글된장 ->Miso파파고 된장 -> Soybean paste그래서 된장찌개를 찾아봤어.이때는 또 구글이 제대로 온다.번역의 일관성이 없다는 거죠.구글 된장찌개→Soybean Paste Stew파파고 된장찌개로 하면 -> bean paste stew된장찌개로 하면 -> Soybean Paste Stew한때는 김치를 일본이 김장을 하면서 그렇게 괴롭혔는데 지금은 중국이 또 김치를 들고 걸려 넘어지는데 정말 이해가 안 되는 게 좋은 걸 놔두고 문화적 열등감이 있나.이제 된장도 준비해야 하는 시대.어느새 된장이 일본 된장으로 둔갑해 있는데 김치처럼 나중에 된장이 중국 된장이라고 말하지 않을 보장이 없지 않은가.일제가 침략하는 대한민국에 있는 식물까지 전수 조사하면서 자신들의 것으로 하기 때문에 학명의 전에 모두 Japanese으로 지었다고 한다.꼭 원산지는 한국인데 학명이 Japanese라고.지금 또 한식 문화를 전에 Chinese와 Japanese가 오르기 전에 제대로 하지 않으면.다행히 아직 한국 요리를 Korean과 정확히 알고 주는 세계인들이 많지만 돈의 논리, 인구 수의 논리로 온라인에 대량의 데이터를 투하함으로써 우리 후손들이 제대로 된 Korean문화와 음식을 Chinese와 Japanese에서 아는 것은 절대 있어서는 안 된다.마지막으로, YouTube를 하려고 자동 번역, 자막을 사용하지 않는 것을 추천합니다.물론 여러 언어를 못하지만 적어도 국문과 영어는 함께 기입하는 것이 옳다.영문까지 하면 영어에서 발설어에 번역 오류만 나오니까.구·리·고 번역이 예전에는 사전의 데이터를 넣어 그 기반에 결과치를 보이고 줬지만 요즘은 AI,”학습”이라는 알고리즘을 사용하기 때문에 일시적으로 다량의 데이터를 유입시키면 그것으로 배운다.garbage in, garbage out. 쓰레기가 들면 쓰레기가 나오거든.즉 나쁜 일을 잘 배우는 것이다.그래서 그 데이터의 유효성과 quality를 봐야 하고 최근의 유행어 AI,”학습”을 위해서는 데이터의 정확성, 다양성을 검증하는 프로세스가 더 중요하다.그런데 그 비용이 상당하다.현장에서는 AI 하면 데이터만 넣으면 바로 벅차다고 하지만, 지금은 20년 전 데ー타마이팅, CRM에서도 성공의 핵심으로 언급된 것은 데이터의 정확성이다.어쨌든 구글 번역 오류에 일일이 참석 버튼을 누르고 의견을 보내도 개선이 되지 않는 거 같고.최첨단 기술을 피로하지만 정작 피드백 프로세스는 아날로그 시대보다 떨어지는 것 같다.구·리·골프·단순히 번역의 오류로만 봐도 글로벌 Top1플랫폼에서 수치가 아니다?번역이 되지 않으면 AI는 멀다는 것이라고 생각하지만. 어쩌면 구글의 DNA가 마침 거기까지야?옛날의 스마트 유리도 뭔가 사라지고.무인 비행체도 준다며 용두사미하고.PS.YouTuber까지 동원하고 통신망 사용료 간신히 선동하기 전에 자신들의 플랫폼 수준 개선이 처가 아닌?그리고망 사용료 국내 포털 사이트는 내는 거야.역차별이 아닐까?초기에 돈을 낸 국내 포털 사이트는 무엇인가.고속 도로를 처음 다듬을 때 투자하고, toll fee과 배당금으로 긴 시간 투자금을 회수하는데, 나중에 나타나고 고객이 많다.이와 함께 몰래 고객의 국민을 운운하며 환원해야 한다며 이 고속 도로 유료화하는 것은 너무 심한 것은 아닐까?우에쿳크의 아이들이 말하더라.세계 어디에 가서 보고.인터넷이 가장 빠른 나라, 한국도.그래서 많은 글로벌 플랫폼 기업이 테스트하기 쉽게 이득을 보는 것은 사실 아닌가?일제가 침략하고 대한민국에 있는 식물까지 전수 조사하면서 자신들의 것으로 만들기 위해 학명 앞에 모두 재팬즈라고 붙였다고 한다.분명 원산지는 한국인데 학명이 Japanese래.지금 또 한국의 음식문화가 앞에 Chinese와 Japanese가 붙기 전에 정신을 차려야 해.다행히 아직까지는 한식을 Korean으로 정확히 알아주는 세계인이 많지만 돈의 논리, 인구수 논리로 온라인에 대량 데이터를 투하함으로써 우리 후손들이 제대로 된 Korean 문화와 음식을 Chinese와 Japanese로 아는 일은 절대 없어야 할 것이다.마지막으로 유튜브를 하면 자동번역이나 자막을 사용하지 않는 것이 좋습니다.물론 여러 언어를 못하지만 적어도 국문과 영어는 함께 기입하는 것이 맞다.영문까지 해놓으면 영어에서 다른 언어로의 번역 오류만은 풀릴 수 있으니까.구리 고 번역이 예전에는 사전 데이터를 넣어 그 기반으로 결과값을 보여줬지만 최근에는 AI, ‘학습’이라는 알고리즘을 사용하다 보니 일시적으로 다량의 데이터를 유입시키면 그걸로 학습한다.garbage in, garbage out. 쓰레기가 들어가면 쓰레기가 나와.즉, 나쁜 것을 잘 배우는 것이다.그래서 그 데이터의 유효성과 quality를 봐야 하고 최근 유행어, AI, ‘학습’을 위해서는 데이터의 정확성, 충실성을 검증하는 프로세스가 더 중요하다.그런데 그 비용이 상당하다.현장에서는 AI 하면 데이터만 넣으면 금방 벅차다고 생각하지만 이는 20년 전 데이터 마이팅, CRM에서도 성공의 핵심으로 언급된 것은 데이터의 정확성이다.어쨌든 구글 번역 오류에 일일이 참여 버튼을 눌러 의견을 보내도 개선이 안 되는 것 같고.최첨단 기술을 선보이지만 정작 피드백 프로세스는 아날로그 시대보다 떨어지는 것 같다.구리고 단순히 번역 오류로만 봐도 글로벌 Top1 플랫폼에서 창피하지 않을까?번역이 안되면 AI는 멀다는거 같은데 혹시 구글 DNA가 딱 거기까지인가?옛날 스마트 글라스도 뭔가 사라지고.무인차도 한다고 용두사미하고.P.S.유튜브까지 동원해 망 사용료 어떻게든 선동하기 전에 자신들의 플랫폼 퀄리티 개선이 먼저 아닌가?그리고 망 사용료 국내 포털 사이트는 내고 있어.역차별 아닐까?초기에 돈을 낸 국내 포털사이트는 무엇인가.고속도로를 처음 닦을 때 투자하고 톨피와 배당금으로 오랜 시간 투자금을 회수해 가는데 나중에 나타나 고객이 많다.그러면서 몰래 고객 국민 운운하며 환원해야 한다며 이 고속도로 유료화하는 것은 너무 심한 것 아닌가?웨쿡 애들이 그러더라.세상 어디 가봐.인터넷이 제일 빠른 나라 한국이래.그래서 많은 글로벌 플랫폼 기업들이 테스트하기 쉽고 이득을 보는 것은 사실 아닌가?