編者按:Google 這家成立于 1998 年的公司,起于互聯網搜索引擎,其 Android 是移動操作系統當之無愧的霸主,不滿足于語音識別+搜索,而從 2016 年開始了真正意義上的人工智能起點,到如今真正地 All in 了 AI,更是在學術和應用上兩面開花。那么,Google 在 AI 上究竟都實現了什么?我們或許可以從前不久的 Google I/O 上一窺究竟。
很幸運今年又再一次來到 Google I/O 現場,會場仍然在離 Google Complex 不遠的海岸圓形劇場。會議開始之前,主會場人頭攢動,各種歡呼聲,結伴照相的聲音此起彼伏,恍若入了慶典的海洋。這三天的會場萬里睛空,除了在 Keynote 中某個團體開著飛機拉橫幅之外,基本上沒有出現其他干擾。由于 Keynote 的一些圖片已經滿天飛大家也看到了許多,筆者就現場抓拍了 Google Brain 的老大 Jeff Dean 出場的畫面。
這應該是這位大佬,為數不多的在 Google I/O 出場的場景。
既然各個 Session 的全程視頻網上都有,那我就專注于 Google I/O 大會 AI 相關的展臺,今年的 ML 相關的展臺也設的比較特殊,就在會場入口不遠處。
整個 I/O 的標志是 I/O Lankmark 的位置,而 AI 相關的展廳便是附近的 G 位置,得天獨厚。我在第二天的下午,就跑到 AI 相關的展臺,去看看里面倒底有什么。
所有的展廳外面都是搭的帳篷,ML+AI 放在一個展廳,用最醒目的大紅色加以標注。
Google AI Research
進門右拐,可以看到 Google AI Research 的展位。人工智能發展到今天,數據越來越重要,誰掌握了數據,誰就能夠做出更好的 AI 模型,數據是人智能的食糧。大公司可以以數據取勝,那么,對于眾多開發者,探索人工智能如何落地的工程師,如何得到有效的數據呢?Google AI 搜索主要解決數據集的問題,讓你免費獲得可以公開的數據集。
我們知道,Google 最強有力的武器便是它的搜索工具,便攜,好用。而且不會出現各種詐騙信息。那么,Google 對于數據集專門出了一個搜索通道,會加速 AI 的學習使用。
附數據專項搜索引擎的地址:
https://toolbox.google.com/datasetsearch
我們以 students 為關鍵字,查找一下數據。打開頁面為:
https://toolbox.google.com/datasetsearch/search?query=students&docid=aTkZB%2F0%2F6kN6Bq6AAAAAAA%3D%3D
整個結果頁面如下:
總共搜出了超過 100 個數據集。我們就從第一個數據集 kaggle 來看一下,搜出了什么樣的結果:
通用屬性,告訴我們一份關于中學生的社會、性別的學習數據,可以看出酒精消耗程度。然后我們拿到這些數據的詳細信息,包括來源網站、上傳日期、數據來源、許可、可下載的文件格式。
數據詳繼描述,說明了這份數據可以用來預測學生的最終級別。在描述中,共有 30 個數據域,把每一個域的數據的意義,標識都解釋的一清二楚。
完全是妥妥的一份完全數據清洗之后的數據嘛??梢阅脕碇苯佑昧恕?/p>
一個搜索引擎,做這么貼心。真的很不容易,是不是需要感動一下?
AI on Edge
上面這張照片所顯示的是一個 Edge 端的 Demo 演示,整個演示過程如下:
有一個上面帶有數字標記的圓盤,圓盤編號從 1 到 8.先把圓盤投到右邊的斜槽上,圓盤滾動到最右邊,然后用帶攝像頭的 Edge TPU 去識別圓盤上的數字,如果識別完之后,自動的轉動右邊的黑色大的圓圈中的白色的通道,使得這個通道連通最下面用數據標識的槽。然后帶數字的圓盤就會掉落到對應數字的槽中。
左邊是一個顯示器,顯示器展于從 1,2,3,4,5,6,7,8 這 8 個數字的圓盤的識別情況,照片正好識別的數字 1 的情況,我們能夠看到顯示屏的瀏覽器中,這個 Demo 的名稱為“Vision Intelligence with AutoML and Edge TPU”。 用 AutoML 和 Edge TPU 實現視覺智能。
我起初覺得就是用 Edge TPU 實現簡單的數字分類,難度在于圓盤識別的數字可能是歪的,需要調正,然后再識別。但是展臺工作人員告訴我,這個 Demo 完成了兩個功能,一個功能是識別數字,打開對應通道,另一個功能是檢查圓盤有沒有破損情況,如果有破損,那么會標記出來,在顯示屏上會顯示”break”。相當于是 2 個 AI 模型共同工作,得出的結果。
即使只是一個小小的 Demo,但背后的技術含量還是很高的。
那么,讓我們的思緒亂飛一會兒,這樣的 Demo 有什么樣的實際應用場景?而且我們用不同的 AI 模型相互搭配、亂入,可以獲得什么奇妙的應用場景呢?歡迎留言討論。
Custom&Pre-Trained Models
Custom&Pre-Trained Models 這個展臺實際上向我們展于,我們在視頻中,實時識別的數據,我們可以做什么樣的處理,達到我們想到的結論。再補上一張圖:
這張圖也是這個展臺中的,相當于用這個模型,可以分燈出人、飛機、汽車等一些對象。如果是攝像頭處理的視頻流,那么,可以用時間記錄下來,在時間軸上,什么時間識別出了什么樣的物體?這個類型的識別,更能夠用于人口流量的統計等場合。比如一個十字路口,每一秒,每一天過了多少人?如果人流量太大,可以做一些分流。
Dance Like
這應該是具有互動性的一個展臺了。
這個展臺實際上想展示 AI 在舞蹈方面的應用。首先站在背景的男士,可以看到他的對面有一個顯示器,顯示器上是一個舞蹈老師在跳舞。我們學舞蹈時,也會這樣做,前面有一個老師,現場教學。在前面,觀眾可以看得到的顯示器有兩個畫面,左邊的畫面是真實的跳舞的人的動作。右邊的畫面是舞蹈老師和跳舞的小伙子重疊的影像。而且能夠實時的看到姿勢的差異。我們用另一張圖片展現一下。
這張圖片就更明顯了,在這個時間點上,后面跳舞的帥哥是正面稍微下蹲的姿勢,但是老師是擺腿的姿勢,完全不一樣。對于學習跳舞來說,這是一個很好的產品。但是我突然有種不好的感覺。這個產品對于人的模仿能力,是極大的考驗啊。這完全是用 AI 跟人在磨啊,AI 吊打人類啊。
總結
這次的 I/O 之行,聽了很多演講,主要在 AI 的展廳實地觀摩了一翻,還有一些 AI 展臺沒有介紹。但是上面這四個展臺給我的印象特別深。對于數據處理,結論分析,實際的應用場景,都有展示??梢哉f,展臺產品涉及到 AI 從數據到實際產品的幾個主要環節,對于開發者,公司運用 AI 提供了特別好的示例。隨著 AI 的應用越來越廣泛,相應的落地應用會越來越多。
-
Google
+關注
關注
5文章
1789瀏覽量
59034 -
AI
+關注
關注
88文章
35164瀏覽量
279893 -
人工智能
+關注
關注
1806文章
49028瀏覽量
249503
原文標題:Google All in AI都做了什么?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Google Fast Pair服務簡介
2025 Google I/O大會演講亮點回顧
在Google Colab筆記本電腦上導入OpenVINO?工具包2021中的 IEPlugin類出現報錯,怎么解決?
AI在芯片上的應用:革新設計與功能
Arm技術助力Google Axion處理器加速AI工作負載推理

如何利用Google Play實現出海應用增長

Google兩款先進生成式AI模型登陸Vertex AI平臺
AI編程在工業自動化設備上應用趨勢
如何在Android上構建自定義AI功能
在設備上利用AI Edge Torch生成式API部署自定義大語言模型

Google AI Edge Torch的特性詳解

評論