北京智源推出通用视觉 AI 模型 SegGPT:可自动追踪并分割影音中的物体

IT之家 2023-05-31 13:44:04


【资料图】

IT之家 5 月 31 日消息,在 2023 年中关村论坛人工智能大模型发展论坛中,北京智源人工智能研究院推出了旗下通用分割模型 SegGPT(Segment Everything In Contex)。

▲ 图源 Arxiv

据称,SegGPT 模型是智源通用视觉模型 Painter 的衍生模型,具备上下文推理能力,在训练完成后只需要提供示例即可推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等,都可以利用视觉提示词(Prompt)完成分割任务。

▲ 图源 Arxiv

SegGPT 也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割,并且可以用掩码的颜色作为物体的 ID,进行自动追踪。

IT之家经过查询知悉,此前 Meta 也发布了其基于 AI 的 Segment Anything Model (SAM)模型 ,具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出 SEEM 模型,通过不同的视觉提示和语言提示,一键分割图像、视频。IT之家的小伙伴们可以从这里访问模型的论文链接。

x

热门推荐

北京智源推出通用视觉 AI 模型 SegGPT:可自动追踪并分割影音中的物体

2023-05

全球观焦点:芳香产业香飘四方

2023-05

天天播报:美媒:加拿大枯木堆储存数百万吨碳,相当于250万辆汽车一年排放量

2023-05

世界头条:观点丨数字化转型是教师学习的必然进阶

2023-05

海南御景名城房价现在什么价格?御景名城内部环境怎么样? 今日热门

2023-05

不锈钢材质 苹果早期Apple Watch原型曝光 全球今亮点

2023-05

仁度生物:5月30日融券净卖出1810股,连续3日累计净卖出3402股

2023-05

“占芭花开”文化之夜丨老挝国家广播电视台新闻记者嘎代·马诺萨:中老铁路“一票难求”

2023-05

环球即时看!「问题少年」逆袭成万亿美元掌门人!60岁黄仁勋或成LLM爆发背后最大赢家

2023-05

全球微资讯!唐山市友谊中学招生办2020(唐山友谊中学招生简章)

2023-05

推荐阅读

小米开始在越南生产手机 此前主要在中国和印度

2022-07

市民仍需注意防暑降温 本周或有局地强对流天气

2022-07

内蒙古满洲里市启动第四轮大规模核酸检测

2021-12

微博博主“鹿道森”确认身亡 警方:排除他杀

2021-12

失联摄影师“鹿道森”确认身亡 尸体被打捞上岸

2021-12

黑龙江讷河第二轮全员核检结果皆为阴性

2021-12

2021天象剧场收官:月“会”群星、日全食、流星雨扎堆亮相

2021-12

陕西新增1例境外归国集中隔离期满确诊病例

2021-12

内蒙古新增本土确诊病例91例

2021-12

宁夏银川警方破获2起以“互联网+物流寄递”为模式的特大毒品案件

2021-12