女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)圖像學(xué)和圖像處理詳解

新機(jī)器視覺(jué) ? 來(lái)源:大前端視野 ? 2023-12-21 16:15 ? 次閱讀

計(jì)算機(jī)視覺(jué):Computer Vision

一門(mén)讓計(jì)算機(jī)從圖像中提取有用信息并加以分析的科學(xué)。這些信息后續(xù)可以用于輔助一些決策或者任務(wù),比如醫(yī)學(xué)圖像分析、工程測(cè)量、自動(dòng)駕駛機(jī)器人學(xué)等等。

計(jì)算機(jī)圖像學(xué):Computer Graphics

通過(guò)使用數(shù)學(xué)模型和計(jì)算機(jī)算法來(lái)生成圖像。

圖像處理:Image Process

0415afac-9762-11ee-8b88-92fbcf53809c.png

圖像數(shù)字化:

空間采樣、量化、與連通性策略是將圖像做數(shù)字化表達(dá)過(guò)程中涉及到的重要概念。

量化:將每個(gè)像素點(diǎn)在色彩通道內(nèi)的亮度按照區(qū)間從連續(xù)分布轉(zhuǎn)化為離散分布的過(guò)程。

四連通與八連通:像素點(diǎn)計(jì)算領(lǐng)域的劃分標(biāo)準(zhǔn)。

四連通:像素四條邊相連的區(qū)域

八連通:比四連通多四個(gè)角。

距離:

歐式距離 (Euclidean) - 兩點(diǎn)之間的直線距離

0429e486-9762-11ee-8b88-92fbcf53809c.png

曼哈頓距離 (City Block) - 沿著方格線行走的兩點(diǎn)間距(即僅水平和豎直四個(gè)方向移動(dòng))

043e40c0-9762-11ee-8b88-92fbcf53809c.png

切比雪夫距離距離 (Chess Board) - 沿著方格線及對(duì)角行走的兩點(diǎn)間距(即水平、豎直、以及對(duì)角八個(gè)方向移動(dòng))

0448dada-9762-11ee-8b88-92fbcf53809c.png

一張圖片中往往有前景(foreground)和背景(background):

確定前景和背景的連通性策略,通常有:

背景四連通、前景八連通

背景八連通、前景四連通

一般有遞歸算法、順序標(biāo)記法。

遞歸算法消耗性能大:遍歷圖像中所有的像素點(diǎn),遇到未標(biāo)記區(qū)域編號(hào)的點(diǎn)即遞歸用當(dāng)前的區(qū)域編號(hào)標(biāo)記與之相連的所有像素點(diǎn)。

順序標(biāo)記法:運(yùn)用與像素區(qū)域連通性問(wèn)題

圖像數(shù)據(jù)的收集和處理:

借助語(yǔ)義化分割對(duì) UI 圖像進(jìn)行處理,得到輪廓、結(jié)構(gòu)、上下文等特征。

借助超級(jí)像素的方法來(lái)降低特征的數(shù)量,合并像素達(dá)到降低干擾因素的效果。

采用 OpenCV 進(jìn)行測(cè)量、計(jì)算,然后用規(guī)則嘗試提取有用的特征數(shù)據(jù),結(jié)果并不理想,它更加擅長(zhǎng)測(cè)量和計(jì)算:需要大量的閾值約束才能達(dá)到比較好的效果:

機(jī)器視覺(jué)的模型和算法來(lái)解決。這邊介紹 2 個(gè)模型:

MaskRCNN

2017年,Kaiming He等人提出了Mask R-CNN,是一種目標(biāo)檢測(cè)和實(shí)例分割的算法

045f65a2-9762-11ee-8b88-92fbcf53809c.png

Mask R-CNN(Mask Region-based Convolutional Neural Network)是一種用于目標(biāo)檢測(cè)和實(shí)例分割的深度學(xué)習(xí)模型,它是 Faster R-CNN 的擴(kuò)展,同時(shí)可以生成目標(biāo)的二進(jìn)制掩碼(mask),因此可以實(shí)現(xiàn)精確的實(shí)例分割。

1、骨干網(wǎng)絡(luò):Mask R-CNN通常使用骨干網(wǎng)絡(luò)(如 ResNet)來(lái)提取圖像特征。這些特征用于目標(biāo)檢測(cè)和分割任務(wù)。

2、區(qū)域建議網(wǎng)絡(luò)(RPN):RPN 用于生成候選區(qū)域,它是 Faster R-CNN 中的組件,用于確定可能包含目標(biāo)的圖像區(qū)域。

3、目標(biāo)檢測(cè):Mask R-CNN 使用區(qū)域建議來(lái)檢測(cè)圖像中的目標(biāo)對(duì)象,通常通過(guò)分類(lèi)和回歸來(lái)確定每個(gè)目標(biāo)的位置和類(lèi)別。

4、實(shí)例分割:除了目標(biāo)檢測(cè),Mask R-CNN 還生成每個(gè)檢測(cè)到的目標(biāo)的精確二進(jìn)制掩碼。這允許對(duì)目標(biāo)進(jìn)行精確的像素級(jí)分割。

5、多任務(wù)學(xué)習(xí):Mask R-CNN 采用多任務(wù)學(xué)習(xí)的方法,通過(guò)同時(shí)訓(xùn)練目標(biāo)檢測(cè)和實(shí)例分割任務(wù),從而提高模型的性能。

6、ROI Pooling / ROI Align:用于從特征圖中提取每個(gè)候選區(qū)域的特征,以供后續(xù)任務(wù)使用。

7、損失函數(shù):Mask R-CNN 使用多個(gè)損失函數(shù),包括分類(lèi)損失、回歸損失和分割損失,來(lái)訓(xùn)練模型。

Yolo V3

2016年,Joseph Redmon等人提出的 YOLO 是一種單階段的目標(biāo)檢測(cè)算法,突破性地實(shí)現(xiàn)了實(shí)時(shí)目標(biāo)檢測(cè)。

實(shí)例分割(instance segmentation)是機(jī)器視覺(jué)研究中比較重要、復(fù)雜和具有挑戰(zhàn)性的領(lǐng)域之一。在機(jī)器人,自動(dòng)駕駛,監(jiān)視等領(lǐng)域均有應(yīng)用。

來(lái)源:大前端視野

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29463

    瀏覽量

    211469
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1324

    瀏覽量

    57685
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7626

    瀏覽量

    90135

原文標(biāo)題:計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)圖像學(xué)、圖像處理等你會(huì)不會(huì)?

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    計(jì)算機(jī)圖形圖像處理最新應(yīng)用分析

    計(jì)算機(jī)圖形圖像處理最新應(yīng)用分析 圖形圖像處理是研究計(jì)算機(jī)除了圖形圖像的原理、方法和技術(shù)的科學(xué)。它是計(jì)算機(jī)
    發(fā)表于 09-23 14:56

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)的關(guān)系簡(jiǎn)述

    計(jì)算機(jī)視覺(jué)是一門(mén)獨(dú)立的學(xué)科,有著30年左右的歷史,集圖像處理、模式識(shí)別、人工智能技術(shù)為一體,著重服務(wù)于一幅或多幅圖像
    發(fā)表于 05-13 14:57

    圖像處理計(jì)算機(jī)視覺(jué)相關(guān)的書(shū)籍有哪些

    圖像處理計(jì)算機(jī)視覺(jué)相關(guān)的書(shū)籍
    發(fā)表于 05-20 13:58

    用于計(jì)算機(jī)視覺(jué)訓(xùn)練的圖像數(shù)據(jù)集介紹

    用于計(jì)算機(jī)視覺(jué)訓(xùn)練的圖像數(shù)據(jù)集
    發(fā)表于 02-26 07:35

    基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)

    基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)OpencV是用來(lái)實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)相關(guān)技術(shù)的開(kāi)放源碼工作庫(kù),是計(jì)算機(jī)
    發(fā)表于 11-23 21:06 ?0次下載
    基于OpenCV的<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>技術(shù)實(shí)現(xiàn)

    計(jì)算機(jī)圖形學(xué)總覽:圖像圖像的概念辨析

    計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺(jué)是同一過(guò)程的兩個(gè)方向。計(jì)算機(jī)圖形學(xué)將抽象的語(yǔ)義信息轉(zhuǎn)化成圖形,計(jì)算機(jī)視覺(jué)
    的頭像 發(fā)表于 08-21 09:10 ?6810次閱讀

    基于計(jì)算機(jī)視覺(jué)的自動(dòng)搜索圖像語(yǔ)義分割架構(gòu)

    計(jì)算機(jī)視覺(jué)中,這適用于圖像分類(lèi)和密集圖像預(yù)測(cè)。
    的頭像 發(fā)表于 01-17 17:31 ?3507次閱讀
    基于<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的自動(dòng)搜索<b class='flag-5'>圖像</b>語(yǔ)義分割架構(gòu)

    基于計(jì)算機(jī)圖像處理方法

    圖像是由像素點(diǎn)組成的矩陣,矩陣的每個(gè)點(diǎn)記錄著圖像的RGB值。數(shù)字圖像處理即根據(jù)用戶需求,使用計(jì)算機(jī)技術(shù)對(duì)
    的頭像 發(fā)表于 03-13 16:32 ?5012次閱讀

    計(jì)算機(jī)視覺(jué)學(xué)什么_計(jì)算機(jī)視覺(jué)好找工作嗎

    學(xué)習(xí)計(jì)算機(jī)視覺(jué)需要具備的知識(shí)儲(chǔ)備有:圖像處理的知識(shí)。圖像處理大致包括的內(nèi)容:光學(xué)成像基礎(chǔ)、顏色、
    的頭像 發(fā)表于 07-30 16:57 ?6465次閱讀

    基于計(jì)算機(jī)視覺(jué)的多維圖像智能

    利用攝像機(jī)和其他數(shù)據(jù)源,計(jì)算機(jī)視覺(jué)可以收集有關(guān)公司運(yùn)營(yíng)最重要方面的重要信息,這些信息包括構(gòu)成流程主干的人員、產(chǎn)品、資產(chǎn)和文檔的組合。當(dāng)企業(yè)收集數(shù)字圖像并應(yīng)用深度學(xué)習(xí)算法,通過(guò)對(duì)機(jī)器眼睛“所見(jiàn)”的反應(yīng)來(lái)準(zhǔn)確識(shí)別和分類(lèi)對(duì)象時(shí),
    的頭像 發(fā)表于 08-04 10:39 ?3104次閱讀

    用于計(jì)算機(jī)視覺(jué)訓(xùn)練的圖像數(shù)據(jù)集

    ? 計(jì)算機(jī)視覺(jué)使計(jì)算機(jī)能夠理解圖像和視頻的內(nèi)容。計(jì)算機(jī)視覺(jué)的目標(biāo)是使人類(lèi)
    的頭像 發(fā)表于 12-31 09:33 ?2556次閱讀

    用于計(jì)算機(jī)視覺(jué)訓(xùn)練的圖像數(shù)據(jù)集

    計(jì)算機(jī)視覺(jué)使計(jì)算機(jī)能夠理解圖像和視頻的內(nèi)容。計(jì)算機(jī)視覺(jué)的目標(biāo)是使人類(lèi)
    的頭像 發(fā)表于 02-12 16:13 ?1556次閱讀

    機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)的前20個(gè)圖像數(shù)據(jù)集

    計(jì)算機(jī)視覺(jué)使計(jì)算機(jī)能夠理解圖像和視頻的內(nèi)容。計(jì)算機(jī)視覺(jué)的目標(biāo)是使人類(lèi)
    發(fā)表于 01-28 07:40 ?5次下載
    機(jī)器學(xué)習(xí)和<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的前20個(gè)<b class='flag-5'>圖像</b>數(shù)據(jù)集

    計(jì)算機(jī)視覺(jué)的十大算法

    隨著科技的不斷發(fā)展,計(jì)算機(jī)視覺(jué)領(lǐng)域也取得了長(zhǎng)足的進(jìn)步。本文將介紹計(jì)算機(jī)視覺(jué)領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場(chǎng)景和優(yōu)缺點(diǎn)。這些算法在圖像
    的頭像 發(fā)表于 02-19 13:26 ?1762次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的十大算法

    計(jì)算機(jī)視覺(jué)圖像處理的區(qū)別和聯(lián)系

    計(jì)算機(jī)視覺(jué)圖像處理是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計(jì)算機(jī)視覺(jué)
    的頭像 發(fā)表于 07-09 09:16 ?2081次閱讀