今天早上絡甯跟宇恩拜訪了位在101的Google,一大早的媒體發表會總是貼心的準備點心滿足我們的嘴,這樣手才有力氣把文章寫好啊獺友們你說是不是?(擦嘴)
而今天Google邀請我們參加這場媒體聚會的目的,是要跟大家分享「Google的機器學習」與機器學習對「Google翻譯」帶來的改變,記得之前 AlphaGo 打敗南韓棋王嗎?人工智慧技術發展已超過半個世紀,最近因為AlphaGo、 Quick Draw、Auto Draw等等再度受到關注,也讓「人工智慧」這個看似艱深難懂的技術受到更多人討論
在今天活動上也邀請到Google台灣董事總經理簡立峰,與大家分享Google在「人工智慧」上的發展
簡立峰總經理表示,近年來Google 發展重點從「行動第一(Mobile-First)」轉向「人工智慧第一 (AI-First)」,將機器學習技術應用到使用者日常運用的 Google 產品和服務中, 以改善既有技術、發展跨領域機器學習技術,為使用者帶來更快速、更聰明、 更便利的服務
而人工智慧也並非全新技術,目前已應用於以下領域
運用機器學習攔截垃圾郵件:目前 Gmail 已經可以自動判斷約 99%的垃圾郵件,誤報率降至 0.05%
人工智慧服務:目前人工智慧已應用於機器翻譯、語音辨識、圖像辨識等領域
其他創新應用:將運算視覺(Computer Vision)用於自動駕駛車
另外,Google翻譯產品經理Julie Cattiau跨國視訊跟我們分享「Google翻譯」的發展現況
Julie Cattiau表示「 Google 翻譯扮演重要角色」,目前,網路上有 50%的內容是以英文呈現,但全球卻只有 20%的使用者是以英語為其主要語言;而網路上有近 80%的網頁內容是由包括英語在內的 10 種語言所囊括,包括了中文、俄文、德文、西班牙文、 日文、法文、波蘭文、韓文與葡萄牙文。其中值得關注的是:網路上並沒有印度語以及阿拉伯語言的內容,但這兩種語言就佔了接近 3 億使用者。為了讓全世界的資訊流通,翻譯服務就扮演著非常重要的角色
另外,台灣是 Google 翻譯(Android 版)成長最快的市場,在Android 版本中,台灣使用者年成長 2 倍;而在 iOS 版本中,台灣使用者年成長 60%
從片語式機器翻譯(PBMT)到神經機器翻譯(NMT) 大幅改善 Google 的翻譯品質,去年九月宣布的 Google 神經機器翻譯系統(Google Neural Machine Translation, GNMT),這個端對端的學習架構,則是將整個輸入的句子視為一個單位進行翻譯。這能讓系統從數百萬的例子學習,提昇翻譯品質
下面有個英翻中的案例給獺友們看,導入神經網路翻譯後,句子變得更加通順~
Zero-Shot 讓兩種語言經過訓練後可自動學習,且不需訓練就能自動翻譯另一種全新語言!
簡單來說,Zero-Shot 翻譯在進行英日、韓英翻譯訓練後,不僅可完成英日、日英、英韓、韓英的互譯,更可在藉由導入 Zero-Shot 翻譯就能完成之前沒有經過任何相關訓練的第三種語言
另一種神經網路應用是「即時鏡頭翻譯(Word Lens)」,目前支援中英對翻,而現場示範的則是能即時日翻英的功能
即時鏡頭翻譯運作方式
1. Google 翻譯應用程式必須從鏡頭拍攝的圖片中找出目標文字
2. 透過深度學習技術,Google 翻譯能夠辨識出每個文字
3. 系統將在我們的字典中尋找並轉換出翻譯結果
小結
「Google翻譯」對我們使用者來說是個十分方便的工具,只要遇到不懂的字,一輸入就能獲得解答,但是我們都知道翻譯也會出現一些不合句意,甚至是硬邦邦的死板翻譯,因此Google在翻譯部分導入了機器學習的技術,持續改善神經機器翻譯系統,不斷地糾正、學習,更結合社群、使用者的回饋力量,讓Google機器翻譯也能學習精進!Google翻譯的下一步是加強數字與日期翻譯,簡短、罕見字串翻譯,以及名詞與品牌解釋,在今天活動也有媒體提出許多問題,雖然離完美的翻譯Google還有一段路要走,但機器學習確實讓我們體會到人工智慧的厲害,希望以後連火星文都能翻XD
獺友募集中!!加入電獺少女LINE@生活圈,每天都有好玩的事情LINE給你哦