九種3D Lidar-SLAM算法評估
當(dāng)機(jī)器人處在照明條件不足且無法使用GPS的地下(SubT)環(huán)境中,其自主導(dǎo)航是一項(xiàng)極具挑戰(zhàn)性的任務(wù),....
3D視覺,如何快速接點(diǎn)「私活」?
在工坊平臺,常常會(huì)有企業(yè)老板聯(lián)系我們,希望工坊能夠快速幫忙對接相應(yīng)人才,以幫忙解決項(xiàng)目中棘手的難題,....
通用視覺GPT時(shí)刻來臨?智源推出通用分割模型SegGPT
無論是 “一觸即通” 還是 “一通百通”,都意味著視覺模型已經(jīng) “理解” 了圖像結(jié)構(gòu)。SAM 精細(xì)標(biāo)....
基于深度學(xué)習(xí)立體匹配的基本網(wǎng)絡(luò)結(jié)構(gòu)和變種
我們可以利用下圖來描述它們的共同點(diǎn),它們都是由左右兩條分支組成了特征提取的網(wǎng)絡(luò),提取出來的特征圖都會(huì)....
CVPR2023:IDEA與清華提出首個(gè)一階段3D全身人體網(wǎng)格重建算法
三維全身人體網(wǎng)格重建(3D Whole-Body Mesh Recovery)是人類行為建模的一個(gè)重....
基于imu定位的方法,如何解決累積誤差?
現(xiàn)在精度最好的imu一個(gè)小時(shí)會(huì)累積幾十米的誤差,價(jià)格上百萬美元,用在洲際彈道導(dǎo)彈上的(你老板買得起?....
GPU利用率低常見原因分析及優(yōu)化
本文的 GPU 利用率主要指 GPU 在時(shí)間片上的利用率,即通過 nvidia-smi 顯示的 GP....
ImPosing:用于視覺定位的隱式姿態(tài)編碼
先通過圖像編碼器計(jì)算表示圖像向量。然后通過評估分布在地圖上的初始姿態(tài)候選來搜索相機(jī)姿態(tài)。姿態(tài)編碼器對....
自動(dòng)駕駛建圖定位之RTK簡介
移動(dòng)站和基站觀測到的共同衛(wèi)星數(shù):RTK精確定位要求要求移動(dòng)站與基站觀測到5顆以上同樣的多頻段衛(wèi)星才能....
基于YOLOv7的關(guān)鍵點(diǎn)模型測評
今年4月,yolo-pose也掛在了arvix,在論文中,通過調(diào)研發(fā)現(xiàn) HeatMap 的方式普遍使....
NeRF2NeRF神經(jīng)輻射場的配對配準(zhǔn)介紹
我們介紹了一種神經(jīng)場成對配準(zhǔn)的技術(shù),它擴(kuò)展了基于優(yōu)化的經(jīng)典局部配準(zhǔn)(即ICP)以操作神經(jīng)輻射場(Ne....
DeepFusion:基于激光雷達(dá)和相機(jī)深度融合的多模態(tài)3D目標(biāo)檢測
在Waymo Open Dataset上,DeepFusion分別提高了幾種主流的3D檢測模型的精度....
人臉識別路漫漫:清華、北大等提出AT3D人臉識別系統(tǒng)攻擊方法
如上圖中打印一張人臉紋理紙貼臉上,這種人看起來怪怪的操作,早期也是可以讓人臉識別系統(tǒng)陷入錯(cuò)誤的,但在....
OpenCV中八種不同的目標(biāo)追蹤算法
分類器的任務(wù)是將圖像的矩形區(qū)域分類為對象或背景。分類器接受圖像區(qū)域作為輸入,并返回介于0和1之間的分....
復(fù)雜約束下自動(dòng)駕駛車輛的運(yùn)動(dòng)規(guī)劃解析
車輛運(yùn)動(dòng)受到運(yùn)動(dòng)學(xué)約束,比如它不能實(shí)現(xiàn)瞬時(shí)側(cè)向移動(dòng),前驅(qū)的車輛必須依賴前輪的轉(zhuǎn)向才能實(shí)現(xiàn)變道、轉(zhuǎn)向等....
介紹一種高效的線云重建算法ELSR
提出了一種高效的線云重建方法,稱為ELSR,其利用了城市場景中常見的場景平面和稀疏的3D點(diǎn)
運(yùn)動(dòng)目標(biāo)檢測算法簡介及其應(yīng)用
運(yùn)動(dòng)目標(biāo)檢測的主要目的是從圖片序列中將變化區(qū)域或者運(yùn)動(dòng)物體從背景圖像中分離出來,常用于視頻監(jiān)控、異常....
Point-NN: 即插即用,無需訓(xùn)練的非參數(shù)點(diǎn)云分析網(wǎng)絡(luò)!
從PointNet++起,包括最遠(yuǎn)點(diǎn)采樣(FPS)、k近鄰(k-NN)和池化操作在內(nèi),所有可學(xué)習(xí)模塊....
從零學(xué)習(xí)自動(dòng)駕駛—百度Apollo高精地圖
首先需要解決的問題是——什么是高精地圖?這要先從我們平時(shí)開車、出行所使用的導(dǎo)航地圖說起。當(dāng)我們想去某....
自動(dòng)駕駛路徑規(guī)劃:A*(Astar)算法
要實(shí)現(xiàn)最佳優(yōu)先搜索我們必須使用一個(gè)優(yōu)先隊(duì)列(priority queue)來實(shí)現(xiàn),通常采用一個(gè)ope....
OpenAI發(fā)布GPT-4,有哪些技術(shù)趨勢值得關(guān)注?
在這個(gè)情形下,其它技術(shù)相對領(lǐng)先的公司有兩種選擇。一種是做更極致的LLM開源化,比如Meta貌似選擇了....
GO-Surf: 用于快速、高保真RGB-D表面重建的神經(jīng)特征網(wǎng)格優(yōu)化
GO-Surf使用多級特征網(wǎng)格和兩個(gè)淺層MLP解碼器。給定一個(gè)沿射線的采樣點(diǎn),每個(gè)網(wǎng)格通過三線插值進(jìn)....
機(jī)器人導(dǎo)航技術(shù):SLAM創(chuàng)新點(diǎn)前世今生分析
SLAM(simultaneous localization and mapping)全稱即時(shí)定位與....
介紹第一個(gè)結(jié)合相對和絕對深度的多模態(tài)單目深度估計(jì)網(wǎng)絡(luò)
單目深度估計(jì)分為兩個(gè)派系,metric depth estimation(度量深度估計(jì),也稱絕對深度....
OV2SLAM(高速視覺slam)簡析
視覺里程計(jì)最近幾年越來越受到學(xué)術(shù)界以及工業(yè)界的認(rèn)可,以O(shè)RB和VINS為代表的視覺SLAM已經(jīng)可以滿....
用于快速高保真RGB-D表面重建的神經(jīng)特征網(wǎng)格優(yōu)化的GO-Surf
我們提出了GO-Surf,一種直接的特征網(wǎng)格優(yōu)化方法,用于從RGB-D序列中準(zhǔn)確和快速地重建表面。
教你如何做機(jī)器人與視覺的融合仿真
四旋翼無人機(jī)自發(fā)明以來已經(jīng)有了非常長遠(yuǎn)的發(fā)展,現(xiàn)階段對四旋翼無人機(jī)的運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)模型已經(jīng)有了很多較....
路徑規(guī)劃算法之柵格地圖繪制
a. 本欄路徑規(guī)劃利用矩陣(二維數(shù)組)來表示柵格地圖(因?yàn)閷τ诰仃嚕瑹o論MATLAB、C++還是Py....
一種用于自監(jiān)督單目深度估計(jì)的輕量級CNN和Transformer架構(gòu)
自監(jiān)督單目深度估計(jì)不需要地面實(shí)況訓(xùn)練,近年來受到廣泛關(guān)注。設(shè)計(jì)輕量級但有效的模型非常有意義,這樣它們....