[出門] Google機器學習能做到你沒想過的事 : 尋找未知行星、基因是否變異


機器學習是什麼?能怎麼運用?

先前詩伊有跟大家分享過一篇快訊,關於Google將用機器學習來判別飛機是否會Delay,但除了航班,機器學習當然還有別的應用囉,今天(2/6)早上,Google就舉辦了一場媒體聚會,來跟大家分享Google如何將機器學習應用在不同領域!

機器學習是什麼呢?字面上來說,就是「讓機器去學習」,但怎麼做?簡單舉個例子,如果我想要讓電腦知道「這是林詩伊」,那科學家可以利用大量的、不同角度而且有各種特徵的照片做成一個資料庫,讓機器讀取,然後知道「長這樣的人是林詩伊」,這技術可以怎麼做呢?

▼聚會上Google舉利用如何用大量貓咪照片讓電腦一層層「學會」什麼是貓

讓人類認識得更快更遠:克卜勒計畫(克卜勒任務/Kepler mission)

2009年五月開始的克卜勒計畫,是一項由NASA執行的任務,目的在於探索除了太陽系以外的其他星系,克卜勒望遠鏡已蒐集到超過二十萬顆恆星的亮度,過去天文學家會透過電腦演算法試圖找到行星的訊號,然後由天文學家來判別這個訊號是否來自行星,但蒐集來的資料數據太龐大惹!一一判別會花太多時間,機器學習可以透過當中的「卷積神經網路(convolution neural network)」運算模型來辨識,這個卷積神經網路也被應用在Google相簿中,常用於辨識圖像分類,科學家把觀測到的訊號轉為圖像之後,讓機器來協助辨別恆星,把可能為行星的訊號呈現給人類辨別,這樣的應用下,也發現了克卜勒90i以及克卜勒80g!

目前透過機器學習來找行星還有一些沒解決的問題,比如說目前還沒辦法讓機器自己辨識出行星的訊號是確切來自何方,所以還是要靠天文學家來確認偵測到的行星位置

不只往外看,也能深度了解人類基因:變體識別(Variant Calling)+深度學習(Deep Learing)

機器學習也會被用在「基因組測序」,對於「變體識別」相當重要……聽起來很難對不對,簡單來說,變體識別就是找出你的基因中跟別人不一樣的地方,雖然跟別人不同的基因不代表會產生病變,但基因組序列可以成為用藥或標靶治療的參考,而科學家從知道你的基因跟別人不一樣?就要透過基因的「測序儀」來知道基因的排列順序

但是!目前的測序儀測出來的結果阿,常常測出來的訊息太片面,或者是有短短的DNA片段──人體內有3億個由鹼基組成的序列,可是測序儀可能只有測出100個鹼基的排序,而目前有太多像這樣太短的訊息──訊息太多又太碎,於是科學家就把這苦差事交給機器去處理!讓機器「深度學習」,電腦從一大堆數據中學到那些參數有用,然後本分析出來的資料讓人們應用,目前這一套深度學習的模組工具,已經發布,而且還成為GitHub中最熱門的生物資訊工具,未來也會應用在不同的方面,譬如其他生物、植物等

雖然這樣看起來機器學習好像離我們很遙遠,但Google在一月左右就發布了AutoML這款建立機器學習模型的工具可供大家使用,最一般的應用大概就是放在商業上了,我先前從沒仔細想過資料庫啊機器學習究竟可以做什麼,頂多就是商業或行銷面的應用,後知後覺的知道原來找尋行星也可以透過機器學習來協助啊!!!現在知道也不算晚吧哈哈

(詩伊聽完之後覺得大腦又被多開發了0.5%……)

注目! 電獺少女YouTube影音頻道熱烈訂閱中,每週最新情報整理、遊戲試玩還有手機操作教學更新,現在就訂閱電獺少女YouTube頻道,同時按下小鈴鐺才能搶先收到新片通知!

詩伊

詩伊

腦袋裡充滿著夢幻的泡泡,忘記是保持樂觀的小訣竅,因為太想保持樂觀了,結果變得很健忘(咦),如果可以的話,希望世界上充滿著快樂的笑:) 最近的願望是:如果可以的話,請把迪士尼樂園變成一個國家,讓我移民過去吧!