123,123

一步直接封神！單步擴散媲美250步教師模型！中科大&amp;字節(jié)發(fā)布圖像生成“分層蒸餾術”

作者：Hanbo Cheng等解讀：AI生成未來亮點直擊系統(tǒng)性分析與統(tǒng)一視角：對軌跡蒸餾（TD）進行了系統(tǒng)性分析，揭示了其本質是一種有損壓縮過程。這一視角解釋了為何TD方法雖然能有效保留全局結構

2025-11-14 16:24 評論

視頻模型在真推理還是“演”推理？港中文等提出新基準拷問:Chain-of-Frame到底是真是假？

作者：Ziyu Guo等解讀：AI生成未來引言近年來，以 Veo、Sora 等為代表的視頻生成模型展現(xiàn)出驚人的生成能力，能夠合成高度逼真、時間連續(xù)的動態(tài)畫面。這些進展暗示，模型在視覺內容生成之外

2025-11-13 16:00 評論

直播革命來了！StreamDiffusionV2：140億參數(shù)實時視頻飆上58FPS！伯克利&韓松團隊等

作者：Tianrui Feng等解讀：AI生成未來亮點直擊 StreamDiffusionV2，這是一個免訓練的流式系統(tǒng)，專為視頻擴散模型設計，用于實現(xiàn)動態(tài)交互式的視頻生成。巧妙整合了SLO-a

2025-11-12 14:18 評論

一文講透自動駕駛中的“點云”

在談及自動駕駛感知系統(tǒng)時，經常會看到一個專業(yè)詞匯，那便是“點云”。作為連接物理現(xiàn)實與數(shù)字世界的橋梁，它賦予機器一種超越人類視覺的深度感知能力，讓車輛得以精確地“理解”自身在環(huán)境中的位置與周遭物體的真實

2025-11-11 14:18 評論

主題一致超越所有開源與商業(yè)模型！中科大&字節(jié)開源統(tǒng)一創(chuàng)新框架BindWeave

作者：Zhaoyang Li等解讀：AI生成未來亮點直擊 BindWeave：針對現(xiàn)有視頻生成技術在主題一致性方面的瓶頸，提出了一個專為主題一致性視頻生成設計的新型框架。引入多模態(tài)大語言模型作為

2025-11-11 13:50 評論

頂刊TPAMI 2025！一個模型搞定所有！多模態(tài)跟蹤“全能王”UM-ODTrack橫空出世

作者：Yaozong Zheng等解讀：AI生成未來亮點直擊 1.為視覺跟蹤領域提供了首個通用的視頻級模態(tài)感知跟蹤模型。UM-ODTrack?僅需訓練一次，即可使用相同的架構和參數(shù)實現(xiàn)多任務推理，

2025-11-10 16:40 評論

好聽、好用、好安全，�？低暣蛟烊拙W絡音頻系統(tǒng)

你能想象嗎？在數(shù)字化技術、網絡技術席卷全球的今天，會議音頻與擴聲系統(tǒng)竟然還大量采用模擬信號技術。然而這種誕生于上世紀的音頻技術，正面臨“三重困境”：首先，信號裸奔。模擬系統(tǒng)通過模擬信號傳輸，像天線一

2025-11-07 16:11 評論

首個基于LLM的開源音頻大模型！階躍星辰重磅開源Step-Audio-EditX：P聲音如此簡單！

作者：Chao Yan等解讀：AI生成未來亮點直擊首個開源的 LLM 音頻編輯模型:Step-Audio-EditX，首個基于大語言模型（LLM）的開源音頻模型，不僅擅長表現(xiàn)力豐富和可迭代的音頻

2025-11-07 14:54 評論

SLAM在自動駕駛中起到什么作用？

在談及自動駕駛時，經常會聽SLAM這項技術。SLAM，即“Simultaneous Localization And Mapping”的縮寫，中文稱為“同時定位與建圖”。SLAM可以解決一個非常關鍵的

2025-11-07 10:22 評論

旅行Agent評測：通義千問VS攜程AIVS豆包

今時不同往日，剛剛過去的2025年十一假期，可以稱得上是AI時代的第一個十一假期。一個全新的概念已經浮出水面：旅行Agent（AI旅行助手）。各大平臺紛紛開始把AI應用于旅行上，無論是規(guī)劃行程、提

大數(shù)據(jù) | 2025-11-06 13:35 評論

小鵬Robotaxi和IRON發(fā)布：物理AI“安全大考”才剛剛開始

“當 AI 從屏幕里的算法，變成能幫你開門、載你通勤的‘物理伙伴’，安全和智能哪個該優(yōu)先？”11 月 5 日小鵬科技日的開場提問，把這場技術發(fā)布會從 “參數(shù)秀” 拉回了普通人的生活場景 —— 當天拋出

2025-11-06 10:26 評論

追覓萬元掃拖機器人怎么樣？實測太能打，換拖布不是噱頭

萬元掃拖機器人竟能如此全面？你有想象過，一萬塊的掃拖洗一體機器人應該是什么樣的嗎？要雷科技說，如果掃拖洗一體機器人要賣到這個價位，它一定是集各種尖端科技于一身的，擁有其它掃拖洗一體機器人所沒有的功

機器學習 | 2025-09-05 09:20 評論

DeepSeek、千問、混元、文心、Kimi與智譜，六大國產大模型，誰是最強“金融分析師”？|錦緞評測

本文系基于公開資料撰寫，僅作為信息交流之用，不構成任何投資建議。每當我們翻閱財報時，可能只想或許關鍵的財務信息，但總是受到財報中紛繁復雜的業(yè)務表述、冗長的管理層發(fā)言的干擾，需要耗費大量精力去甄別有用

操作系統(tǒng) | 2025-07-21 15:43 評論

國產視頻大模型大橫評：可靈、即夢不分仲伯，表現(xiàn)最差的竟是它？

視頻大模型能圓我們的導演夢？視頻生成大模型，能幫助我們成為視頻創(chuàng)作者嗎？前段時間，AI歌手Yuri火爆全網，不少網友驚嘆AI大模型生成的視頻居然真假難辨，口型和聲音近乎完美同步。完全由AI創(chuàng)作

自然語言處理 | 2025-07-04 09:12 評論

上線秒空、股價大漲！小米AI眼鏡正面對剛Ray-Ban Meta 供應鏈+性能+生態(tài)全拆解

6月26日晚，小米人車家全生態(tài)發(fā)布會上，雷軍親自發(fā)布了自家的全新智能產品——小米AI眼鏡。該產品售價1999元起，共包含標準版在內的三個版本。其中，電子變色版為2699元，彩色電子變色版為2999元，款式包含黑色，玳瑁棕和鸚鵡綠三款，目前均已開售

核心硬件 | 2025-06-30 17:12 評論

DeepSeek搜索大橫評：百度、微博、微信們靠內容決勝負

25年，DeepSeek大有重構一切產業(yè)的勢頭，而最受沖擊的應用當屬搜索。微信將AI搜索作為接入DeepSeek的第一步，有自媒體宣稱此舉將“重構AI搜索”；百度AI搜

2025-03-05 09:09 評論

為AI大模型提供強有力的存儲保證：致態(tài)TiPro 9000 4TB版本評測

目前AI大模型已經成為了科技行業(yè)最受關注的領域，尤其是今年初興起的DeepSeek，更是將大語言模型達到了新的高度，特別是DeepSeek R1的發(fā)布讓眾多企業(yè)都開始了自主模型的部署，完整的671b對于電腦的算力提出了極其嚴苛的要求，不過對于普通消費者來說，32b的模型還是可以嘗試嘗試

2025-03-03 09:11 評論

DeepSeek-R1大戰(zhàn)豆包、Kimi，國產AI大模型第一花落誰家？

盛名之下無虛士。日活用戶突破2000萬，與中國移動、華為、金山辦公、吉利汽車等企業(yè)相繼達成合作，DeepSeek迎來了高光時刻。在互聯(lián)網巨頭爭相進入AI行業(yè)的今天，企業(yè)為實現(xiàn)技術領先，紛紛斥巨資買數(shù)據(jù)和算力芯片，打造萬卡集群

2025-02-07 15:32 評論

體驗了羅永浩的AI應用，我發(fā)現(xiàn)這就是一個大鍋亂燉的AI助理？

待辦清單+錘子便簽+AI聊天+子彈短信+發(fā)牌手？傳聞中的羅永浩的「AI 軟件項目」終于上線了。就在剛剛過去的周末，羅永浩「最后一次創(chuàng)業(yè)」從 AR 轉型 AI 后推出了第一款產品—&md

2025-01-07 09:45 評論

算力荒緩解，自主化智算還有必要嗎？

2023年大煉模型興起，全球范圍內都出現(xiàn)了算力供不應求、一卡難求的情況。各地紛紛興建數(shù)據(jù)中心、智算中心，來解決國產大模型的算力短缺問題。今年算力市場又倒向了另一個方向，算力開始過剩和大量閑置了。主要體

2024-12-31 13:59 評論

資訊訂閱

最新活動 更多 >>

精彩回顧《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》查看回顧
精彩回顧 OFweek 2025（第十四屆）中國機器人產業(yè)大會查看回顧
精彩回顧 Ansys Motion薄膜卷曲卷對卷工藝仿真解決方案查看回顧
精彩回顧 STM32全球線上峰會查看回顧
精彩回顧 2024視覺感知技術在半導體與印刷包裝創(chuàng)新大會查看回顧
精彩回顧全數(shù)會2024中國人形機器人技術創(chuàng)新發(fā)展大會查看回顧

一周熱點

技術文庫 更多 >>

加密芯片筑牢工業(yè)設備防抄板防線
2025-11-14
LKT4202UGM、LKT4305GM國密芯片
2025-10-31
金融級安全加密芯片-LKT4304
2025-04-10
ATSHA204A國產全兼容芯片LCSHA204
2025-02-27
耗材保護芯片-LKT4304解決方案
2025-02-13
LKT4304新一代算法移植加密芯片
2025-01-16