本報(bào)記者 崔 爽
近日,DeepSeek開(kāi)始灰度測(cè)試識(shí)圖模式,并大范圍開(kāi)放給用戶(hù)體驗(yàn)。
在具體的實(shí)測(cè)體驗(yàn)中,開(kāi)啟該模式后,用戶(hù)可以直接上傳圖片讓DeepSeek“看”世界,其能力邊界遠(yuǎn)超簡(jiǎn)單的文字提取。比如,網(wǎng)友上傳在博物館拍攝的不明文物并開(kāi)啟“深度思考”后,模型不僅詳細(xì)描述該文物紋理材質(zhì),還準(zhǔn)確推斷出其年代風(fēng)格;面對(duì)時(shí)下流行的表情包或梗圖,它也能準(zhǔn)確理解。
【資料圖】
DeepSeek“開(kāi)眼”,與其他主流大模型有何能力差異?有哪些優(yōu)勢(shì)和不足?科技日?qǐng)?bào)記者就此采訪(fǎng)了有關(guān)專(zhuān)家。
第一問(wèn):DeepSeek識(shí)圖模式與豆包等其他大模型有何區(qū)別?
“與其他大模型相比,DeepSeek識(shí)圖模式的核心區(qū)別集中在技術(shù)路徑、算力消耗和交互邏輯上。”賽迪顧問(wèn)人工智能與大數(shù)據(jù)研究中心分析師白潤(rùn)軒說(shuō)。
他解釋道,DeepSeek識(shí)圖模式以“視覺(jué)原語(yǔ)思考”為核心。這一核心框架主打精準(zhǔn)空間推理和復(fù)雜場(chǎng)景解析,而非單純的文字OCR(光學(xué)字符識(shí)別)或基礎(chǔ)識(shí)別。而豆包等模型更側(cè)重結(jié)合聯(lián)網(wǎng)搜索提升識(shí)別時(shí)效性,多依賴(lài)傳統(tǒng)圖像編碼后進(jìn)行文本理解,空間推理精度稍弱。
同時(shí),這一框架在實(shí)際運(yùn)行中“算力友好”。白潤(rùn)軒介紹,DeepSeek處理800×800分辨率圖片僅消耗約90個(gè)tokens(詞元),遠(yuǎn)低于GPT等主流模型,響應(yīng)速度更快。
此外,DeepSeek識(shí)圖模式為獨(dú)立入口,專(zhuān)注純視覺(jué)理解,不額外啟用聯(lián)網(wǎng)功能,而豆包等大模型會(huì)自動(dòng)聯(lián)動(dòng)搜索。
第二問(wèn):“視覺(jué)原語(yǔ)思考”的核心創(chuàng)新點(diǎn)在哪?
伴隨識(shí)圖模式的上線(xiàn),DeepSeek還公開(kāi)了其背后的多模態(tài)模型技術(shù)細(xì)節(jié),并公布了“視覺(jué)原語(yǔ)思考”核心框架。
“這一框架的核心創(chuàng)新點(diǎn)在于跳出主流模型‘堆分辨率’的思路,聚焦解決傳統(tǒng)多模態(tài)模型的‘指代鴻溝’困境。”白潤(rùn)軒解釋。
傳統(tǒng)多模態(tài)大模型在面對(duì)密集場(chǎng)景時(shí)存在一種名為“指代鴻溝”的困境,模型雖然能看見(jiàn)圖片,但在推理過(guò)程中用“左邊那個(gè)大的”等模糊的自然語(yǔ)言構(gòu)建邏輯鏈時(shí),很容易因描述不準(zhǔn)導(dǎo)致注意力漂移。
而“視覺(jué)原語(yǔ)思考”框架將點(diǎn)、邊界框等空間視覺(jué)元素作為“思維”基本單元,融入模型推理全過(guò)程,這就像給模型裝上了一根“賽博手指”,讓AI在推理時(shí)能在“腦海”中精確指出目標(biāo)物,邊想邊指,大幅提升復(fù)雜空間布局、密集計(jì)數(shù)等場(chǎng)景的推理精度。
第三問(wèn):目前存在的不足及改進(jìn)方向是什么?
在白潤(rùn)軒看來(lái),DeepSeek識(shí)圖模式目前主要存在三項(xiàng)不足。
一是知識(shí)庫(kù)更新偏滯后。其模型訓(xùn)練數(shù)據(jù)截至2025年,識(shí)別2025年底后發(fā)布的新型產(chǎn)品易出現(xiàn)型號(hào)誤判。
二是高難度場(chǎng)景表現(xiàn)還不穩(wěn)定。面對(duì)視錯(cuò)覺(jué)圖片、復(fù)雜物體計(jì)數(shù)等反直覺(jué)任務(wù)時(shí),模型給出的答案穩(wěn)定性不足,偶發(fā)邏輯崩潰。
三是功能邊界較窄。目前僅支持純視覺(jué)理解,暫不具備圖像生成、視頻理解及跨模態(tài)創(chuàng)作能力,且高并發(fā)時(shí)段偶有解析失敗、響應(yīng)延遲的情況。
“建議后續(xù)加快知識(shí)庫(kù)迭代、優(yōu)化反直覺(jué)場(chǎng)景算法;同時(shí)拓展多模態(tài)功能,進(jìn)一步提升系統(tǒng)穩(wěn)定性以適配更多用戶(hù)的需求。”白潤(rùn)軒說(shuō)。
(責(zé)任編輯:楊淼)網(wǎng)易云音樂(lè)于5月13日斥資1499 4萬(wàn)港元回購(gòu)12 2萬(wàn)股
歸創(chuàng)通橋?qū)⒂?月18日派發(fā)末期股息每股0 2515764港元
4月權(quán)益市場(chǎng)回暖后,私募產(chǎn)品凈值高點(diǎn)密集出現(xiàn)。經(jīng)歷3月震蕩后,A股在4
雙冠王!!!!!!!!!!,莫塔,博尼,拉齊奧,勞塔羅,雙冠王,馬丁內(nèi)斯
3-0!哈蘭德缺戰(zhàn),福登喜迎里程碑,曼城主場(chǎng)大勝,緊咬阿森納,曼城,英
3-0!英超爭(zhēng)冠格局大亂:前2差2分,曼城橫掃水晶宮,福登兩助攻,曼城,
巴黎提前一輪奪得隊(duì)史第14次法甲冠軍,并實(shí)現(xiàn)五連冠,法甲,朗斯隊(duì),五連
智通財(cái)經(jīng)APP訊,中國(guó)石油化工股份(00386)公布,將于2026年6月26日派發(fā)
智通財(cái)經(jīng)APP訊,喜相逢集團(tuán)公布,于2026年5月13日,公司、賣(mài)方明珠資本
中科電氣:公司硬碳負(fù)極現(xiàn)有產(chǎn)能規(guī)模占整體負(fù)極材料產(chǎn)能規(guī)模比重較小人
麥克丹尼爾斯掌摑卡斯?fàn)栆娕蛎裕貉b狠演過(guò)頭了,約基奇,蘭德?tīng)?馬
NBA季后賽周二:1場(chǎng)生死戰(zhàn)!森林狼8點(diǎn)客戰(zhàn)馬刺,聯(lián)盟悼念26歲球星,馬刺
雷迪克談湖人爭(zhēng)冠差距:休賽期需找出答案,湖人,J·J·雷迪克
據(jù)經(jīng)視直播,近期,一則“整條街因惡意退貨太多被商家拉黑”的消息沖上
劉易斯-霍爾:能重回首發(fā)我很開(kāi)心;不認(rèn)同我們球隊(duì)心態(tài)軟弱,開(kāi)心,安德
穆索:奧薩蘇納整場(chǎng)比賽都在抱怨,動(dòng)不動(dòng)就倒地,點(diǎn)球,穆索,歐冠資格,奧
10年支持不變:谷歌力保現(xiàn)有Chromebook,谷歌,安卓,筆記本,macbook,chromebook
C羅社媒鼓勵(lì)球隊(duì):夢(mèng)想已經(jīng)很接近了,我們還剩最后一步,c羅,利雅得,羅
谷歌今夏推進(jìn)GeminiIntelligence:重塑安卓手機(jī)交互,谷歌,安卓手機(jī),知
四川持續(xù)推進(jìn)低空飛行“一站式”服務(wù),空域,飛友,四川省,低空飛行
PlugPower第一季度營(yíng)收超預(yù)期,毛利率大幅改善,股價(jià)觸及年內(nèi)新高
廣東出局揪最大罪人!開(kāi)場(chǎng)3分鐘2犯+全場(chǎng)0分,親手拒掉200萬(wàn)獎(jiǎng)金,徐杰,
據(jù)南方財(cái)富網(wǎng)概念查詢(xún)工具數(shù)據(jù)顯示,輸電鐵塔公司龍頭有:匯金通:輸電
智通財(cái)經(jīng)APP訊,農(nóng)業(yè)銀行發(fā)布公告,中國(guó)農(nóng)業(yè)銀行股份有限公司2026年二
三連板京投發(fā)展:擬收購(gòu)標(biāo)的公司2025年度及2026年第一季度尚處于虧損狀

黑芝麻智能于5月13日斥資2264.5萬(wàn)港
黑芝麻智能于5月13日斥資2264 5萬(wàn)港元回購(gòu)128 38萬(wàn)股

阿森納女足爭(zhēng)議絕殺1比0擊敗埃弗頓
阿森納女足爭(zhēng)議絕殺1比0擊敗埃弗頓,越位,阿森納,埃弗頓,威廉姆森,歐冠資格

隊(duì)史第10冠!意杯決賽:國(guó)米2-0拉齊
隊(duì)史第10冠!意杯決賽:國(guó)米2-0拉齊奧加冕雙冠近5年3次捧杯,莫塔,意杯,

中建富通(00138.HK)2025年度凈虧損3.
格隆匯5月13日丨中建富通(00138 HK)發(fā)布截至2025年12月31日止年度全年業(yè)績(jī)。

紫光國(guó)微:目前未收到間接控股股東新
紫光國(guó)微:目前未收到間接控股股東新紫光集團(tuán)有限公司注入GPU、CPU等相
Copyright @ 2001-2023 m.sjttj.com All Rights Reserved 商業(yè)時(shí)報(bào)網(wǎng) 版權(quán)所有 關(guān)于我們
網(wǎng)站信息內(nèi)容, 均為相關(guān)單位具有著作權(quán),未經(jīng)書(shū)面授權(quán),轉(zhuǎn)載注明出處
未經(jīng)商業(yè)時(shí)報(bào)網(wǎng)書(shū)面授權(quán),請(qǐng)勿建立鏡像,轉(zhuǎn)載請(qǐng)注明來(lái)源,違者依法必究
皖I(lǐng)CP備2022009963號(hào)-4
聯(lián)系郵箱:311 3831 582@qq.com
關(guān)于我們 | 聯(lián)系方式 | 供稿服務(wù) | 版權(quán)聲明 | 友情鏈接 | 合作伙伴 |