女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Google Pixel3在相機算法的升級路上越戰越勇

電子工程師 ? 來源:lq ? 2018-12-03 10:32 ? 次閱讀

想要提高拍照效果,想必對于多數手機廠商而言,給手機塞進更多的攝像頭似乎成了當前主流做法,例如“普通攝像頭+景深攝像頭”、“黑白+彩色攝像頭”、“廣角+長焦攝像頭”……不過,偏偏有這么一家企業反其道而行,從發布 Pixel 系列以來,就一直堅持單攝像頭,并強調在相機成像算法上的提升。

不久前的一篇《勝過 iPhone XS?Google Pixel 的“夜視功能”是怎樣煉成的》文章中,我們介紹了 Google 新款手機 Pixel3 系列的夜景拍攝功能(Night Sight)。果然,讀者們對于如何利用機器學習解決弱光條件下的拍攝難點持有很大興趣。近日,Google Pixel3 在相機算法的升級路上越戰越勇,對“人像模型”(Portrait Mode)拍攝功能進行了大幅升級。相比上一代的 Pixel2,Pixel3 的人像模式可為用戶提供專業的外景圖像拍攝,并通過模糊背景來加強主體對象的清晰度。

去年,Google 團隊描述了相位檢測自動對焦(PDAF)的技術,該技術使用了傳統的非學習立體算法,并通過單個攝像頭計算景深。如今,在最新推出的 Pixel 上,Google 將采用機器學習改進景深捕捉,以獲取更好的人像效果。

如上圖所示,上一代的人像模式主要通過神經網絡決定人與背景成像像素,并使用從 PDAF 導出的景深信息來增強這兩層人物的分割掩碼(segmentationmask)。這意味著能夠實現相應的背景虛化效果,更接近于專業相機的效果。

PDAF 通過捕捉場景的兩個略微不同的視角進行工作,如下圖所示。在兩個視角之間翻轉,我們看到人是靜止的,而背景是水平移動的,這種效果成為視差(parallax)。因為視差是點距相機的距離與兩個視點之間距離的函數,我們可以通過將一個視角中的每個點與另一個視角中的對應點進行匹配來估計景深。

圖注:左、中的兩個 PDAF 圖像看起來非常相似,但在右圖中,可以看到它們之間的視差

不過,通過立體算法在 PDAF 中找到這些對應關系極具挑戰性,因為場景中的點幾乎不在視圖之間移動。此外,所有的立體聲技術都存在孔徑問題(Aperture Problem)。也就是說,機器通過小光圈觀察場景,無法找到與立體基線平行的線的對應關系,即連接兩個攝像頭的線。換言之,當觀察上圖中的水平線(或縱向拍攝的垂直線)時,一個視角相對于另一個視角的任意可能的位移都看起來大致相同。結果,在上一代的人像模式中,以上提到的所有因素都有可能導致景深捕捉錯誤,產生令人不快的虛假圖像。

如何改善景深捕捉?

Pixel3 采用的人像模式,通過利用立體算法產生的視差來修復這些誤差。例如,遠離焦距平面的點看起來不如較近的點那么清晰銳利,利用了“背景離焦”模式。此外,即使在平面屏幕上觀看圖像,也能通過物體的大致大小準確判斷物體有多遠,利用了“語義”模式。

如果構建一種能將以上不同的模式組合起來的算法是非常困難的,但我們可以通過機器學習進行構建,并更好地利用 PDAF 的“視差”。具體來講,訓練一個用 TensorFlow 編寫的卷積神經網絡,可以將 PDAF 作為輸入并進行景深預測。這種新式改進的基于機器學習的景深捕捉方法被應用在了 Pixel3 的人像模式中。

圖注:CNN 將 PDAF 圖像作為輸入,并輸出景深圖像。該網絡使用“編碼-解碼”架構

如何訓練神經網絡?

為了訓練網絡,開發人員需要大量的 PDFA 圖像和對應的高質量景深圖,并且保證訓練數據與用戶使用智能手機拍攝的照片內容類似。為了實現這一目標,我們構建了自己的定制“Frankenphone”裝備,其中包括五臺 Pixel3 手機,以及基于 WiFi 的解決方案,使其能夠同時捕捉來自所有手機的圖片(在~2 毫秒的容差范圍內)。通過這個設備,我們使用來自運動和多視圖立體的結構從照片計算出高質量的景深。

圖注:左:用于收集訓練數據的自定義裝備;中:一個捕獲五個圖像翻轉的示例;右:真實景深,低保真點

該裝備收集的數據適用于訓練網絡,主要基于以下五點因素:

五個視點確保在多個方向上存在視差,因此不存在孔徑問題;

攝像頭的位置要確保圖像中的某一點在至少一張圖像中是可見的,并一一對應;

基線,即相機之間的距離要比 PDAF 的基線大得多,從而產生更準確的景深捕捉;

攝像頭同步確保可以計算上述動態場景的景深;

該裝備具有便捷性,確保可捕捉野外照片,模擬用戶使用智能手機拍攝的情況。

然而,即使從該裝備捕獲的數據是理想狀態,預測場景中物體的絕對深度仍然極具挑戰性,因為取決于鏡頭特性、焦距等因素,給定的 PDAF 對可以對應一系列不同的景深圖像。為了解釋這一點,我們改為捕捉場景中物體的相對景深,這足以產生令人滿意的人像模式結果。

值得一提的是,這個基于機器學習模式的景深捕捉模型目前主要應用于 Pixel3 手機上。此外,通過使用 TensorFlow Lite 用于在移動和嵌入式設備上運行機器學習模型的跨平臺解決方案,可以將得到的景深信息與分割掩碼神經網絡進行結合。

看到這里,不知道習慣了使用 iOS 系統手機的你,是不是正蠢蠢欲動回歸在性能、價位日益提升的 Android 手機呢?

據最新消息稱,Google 決定開放自己的相機算法授權給其他 Android 品牌使用,此前 Google 就開源了 Pixel2 系列的相機虛化算法。歡迎留言。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4807

    瀏覽量

    102761
  • 攝像頭
    +關注

    關注

    61

    文章

    4948

    瀏覽量

    97654
  • AI算法
    +關注

    關注

    0

    文章

    261

    瀏覽量

    12597

原文標題:三攝正普及,四攝在路上?谷歌逆天AI算法,只做單攝虛化

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    遷移科技推出全新3D智能相機

    工業視覺領域迎來里程碑式突破!遷移科技正式發布全系升級3D智能相機,將強悍算力直接嵌入相機內部,替代傳統 “相機 + 工控機 + 顯卡”
    的頭像 發表于 05-29 13:58 ?161次閱讀

    2025年3D工業相機選型及推薦

    3D工業相機的選型
    的頭像 發表于 05-21 16:49 ?152次閱讀
    2025年<b class='flag-5'>3</b>D工業<b class='flag-5'>相機</b>選型及推薦

    濱松光子的相機研發史:ORCA系列與qCMOS的誕生(下)

    ? 自1971年,濱松光子開始研發相機以來(追溯1971,濱松光子的相機研發史(上)),濱松光子的世界里,時間就像是一條長長的路,而他們研發的相機,就像是
    的頭像 發表于 03-17 06:23 ?236次閱讀
    濱松光子的<b class='flag-5'>相機</b>研發史:ORCA系列與qCMOS的誕生(下)

    東風本田300萬輛CR-V越戰越勇

    中國車市依然處在動蕩中。 新能源時代的洗禮下,傳統車企,尤其是合資車企開始走向衰落,一批批曾經風靡市場的品牌和車型被汰換掉,留下來且還能與新勢力一爭高下著的屬實已經不多見了。 東風本田旗下
    的頭像 發表于 01-17 12:28 ?1092次閱讀

    廣和通推出多功能AI紅外相機解決方案

    近日,廣和通推出多功能AI紅外相機解決方案,融合AI算法、AI模型、傳感器,助力戶外打獵、森林防火、國土資源監管、電網監拍等領域智能化升級
    的頭像 發表于 01-15 14:24 ?473次閱讀

    康謀方案 | 多源相機數據采集與算法集成測試方案

    如何滿足不同應用場景下對圖像采集和算法測試的多樣化需求?本文為您帶來多源相機數據采集與算法集成測試方案,通過BRICKplus/BRICK2與ADTF的結合,輕松實現多源相機快速集成和
    的頭像 發表于 12-11 09:59 ?3434次閱讀
    康謀方案 | 多源<b class='flag-5'>相機</b>數據采集與<b class='flag-5'>算法</b>集成測試方案

    谷歌Pixel Recorder應用用戶參與度顯著提升

    Google Pixel 的 Recorder 應用允許用戶錄制、轉錄、保存和共享音頻。為了讓用戶更輕松地管理和回顧自己的錄音,Recorder 的開發者將目光鎖定在功能強大的設備端大語言模型
    的頭像 發表于 11-15 13:46 ?597次閱讀

    谷歌正式向Pixel設備推送Android 15穩定版

    10月17日最新資訊,谷歌今日已正式向Pixel系列設備推送Android 15穩定版更新。目前,已有部分Pixel設備成功完成升級,而更大范圍的推送預計將在本周末進行。
    的頭像 發表于 10-17 16:31 ?873次閱讀

    雙絞線線路上捕獲1394個事件

    電子發燒友網站提供《雙絞線線路上捕獲1394個事件.pdf》資料免費下載
    發表于 09-29 09:41 ?0次下載
    <b class='flag-5'>在</b>雙絞線線<b class='flag-5'>路上</b>捕獲1394個事件

    Pixel 9系列遭Root與解鎖限制,AI功能受阻

    8月28日,XDA開發者論壇曝出,谷歌Pixel 9系列手機經歷Root操作或BootLoader引導加載程序解鎖后,遭遇了AI功能使用的障礙。具體而言,Pixel Screenshots應用陷入“正在下載模型”的無限循環,而
    的頭像 發表于 08-28 17:16 ?2303次閱讀

    深視智能3D相機軸承內徑檢測的應用

    3D相機
    深視智能科技
    發布于 :2024年07月23日 10:33:54

    谷歌Pixel 9系列手機將于8月13日盛大發布

    谷歌震撼宣布:Pixel 9系列手機將于2024年8月13日(北京時間為次日凌晨1點)美國加州山景城總部盛大發布,這一消息瞬間點燃了全球科技迷與消費者的熱情。Pixel 9不僅標志著Pixe
    的頭像 發表于 07-16 14:43 ?1104次閱讀

    今日看點丨臺積電3納米助攻 Google自研手機芯片進入流片階段;傳豐田尋求在上海生產電動汽車

    1. 臺積電3 納米助攻 Google 自研手機芯片進入流片階段 ? 據報道,Google搭載于Pixel 10系列手機的Tensor G5芯片進入Tape-out(流片)階段。Ten
    發表于 07-01 10:41 ?839次閱讀

    使用google-translate和wwe合并后無法使用google-tts怎么解決?

    使用喚醒詞喚醒后,我想讓他使用google-tts說一句話,但是出現以下錯誤Code: Select all I (16188) wwe_example: rec_engine_cb
    發表于 06-28 06:05

    基于FPGA的陣列相機的實時監測和大容量存儲

    ISERDES 解串相機數據 35T 的 DDR3 中 進行降采樣緩存和原圖緩存,然后根據指令讀出緩存數據進行通向 100T 方向的顯示回傳或者進行本地 TF 卡模塊的存儲以便后續的下載;最后完成了 10 個
    發表于 06-20 20:10