在第七个全国科技工作者日来临之际,由中国人工智能学会(CAAI)主办,北方工业大学信息学院承办,CAAI 语言智能专委会、国家语委中国语言智能研究中心协办的“多模态智能计算创新应用论坛”将于2023年5月14日,以线下+线上的方式举办(线上网络直播地址:https://live.bilibili.com/27779117)。
01 论坛日程 2023年5月14日
主持人:张勇东
国家杰青、中国科学技术大学信息科学技术学院执行院长
13:40-14:10主题报告 田奇
题 目: AI for industries,赋能千行百业智能升级
摘 要:随着数据不断积累和算力算法的不断发展,人工智能模型正在变的更大更通用。为了实现普惠AI,赋能千行百业智能升级,华为云发布了语言、视觉、多模态、预测决策、科学计算等系列大模型,建立了一套通用、易用的人工智能工业化开发模式,成功为煤矿、电力、能源、气象、制药等行业实现了智能化转型,为其他行业产业升级打下坚实基础。
14:10-14:40主题报告 吕科
题 目:3D对象分析与生成关键技术与应用
摘 要:随着3D对象数据采集手段的日益增多,3D数据无疑会变得更加丰富,3D对象在各个领域及实际生活中也将越来越被广泛地应用,必将成为多媒体游戏、医学诊断、工业设计、信息检索、计算机图形学以及计算机视觉领域的研究热点。有效利用已有的3D数据或在已有的3D数据基础上进行开发与利用,能够很好地提升产品设计水平和质量。报告将介绍3D对象分析与生成中的相关技术、方法与应用。
14:40-15:10主题报告 蒋树强
题 目:具身智能中的视觉导航技术
摘 要:具身智能是真实物理场景下人工智能的重要表现形态,在动态开放环境的无人系统与人机协同系统中有潜在重大应用价值,视觉导航是具身智能的一项重要任务,是智能系统应用在现实世界中的一项重要能力。在静态且可充分探索的环境中,借助地图定位智能系统能达到令人满意的导航性能。然而对于动态且未知环境,现有技术由于缺乏准确的地图而无法进行高效的导航。相比于机器,人类依赖于对目标先验知识,可以轻松在未知动态环境中高效地寻找并导航至目标物体。如何将人类的视觉导航能力赋予机器是视觉导航任务所关注的问题。本报告将首先报告基于先验知识的视觉导航技术研究现状和进展,包括类别级/实例级物体导航、单物体/多物体导航、物体导航/视觉语言导航等技术,并介绍物体导航从虚拟到真实环境的适配并给出演示
02 专家简介

田奇
华为云人工智能领域首席科学家
国际欧亚科学院院士
IEEE/CAAI Fellow
个人简介:
2018年6月-2020年3月担任华为诺亚方舟实验室计算视觉首席科学家。本科毕业于清华大学电子工程系,后赴美国伊利诺伊大学香槟分校学习,师从Thomas S. Huang教授获博士学位。后历任美国德克萨斯大学圣安东尼奥分校计算机系助理教授、副教授、和正教授(2002-2019),2010年获Google Faculty Research Award, 2017年UTSA校长杰出研究奖、2016年获评多媒体领域10大最具影响力的学者,于2018年入选国家级领军人才创新项目。教育部长江讲座教授、国家自然科学基金海外杰青,中国科学院海外评审专家。国际欧亚科学院院士(2021)、IEEE Fellow (2016), CAAI Fellow(2022), 获得2021年中国人工智能学会吴文俊人工智能杰出贡献奖。IEEE TMM, TCSVT, TNNLS, ACM TOMM、Multimedia Systems Journal等多个期刊的Associate Editor。拥有多项美国专利,在计算机视觉及多媒体方向顶级期刊及会议如IEEE TPAMI,IJCV,TIP,TMM,CVPR, ICCV,ECCV,ACM MM上发表文章约650+余篇(包括200篇 IEEE/ACM期刊和210篇 CCF A类会议文章),谷歌学术引用次数50500+,h 指数为101,有8篇论文获最佳论文奖或者最佳学生论文包括ACM Multimedia 等。

吕科
中国科学院大学特聘教授
国家级领军人才
个人简介:
博士生导师,科技部创新人才推进计划“中青年科技创新领军人才”,北京市高等学校高层次人才引进与培养特聘教授,享受国务院政府特殊津贴专家。主要研究方向为图像处理、智能信息处理技术。承担国家自然科学基金、国家重点研发计划项目(课题)、中国科学院仪器设备等科研项目三十余项。在国内外学术期刊和国际主流会议上发表学术论文150余篇,出版编著两部。研究成果先后获2004年度、2009年度国家科技进步二等奖、2012年度北京市科学技术二等奖、2012年度中国电子学会电子信息科学技术二等奖, 2017年获得中国科学院成果转化奖。

蒋树强
国家杰青获得者
中科院智能信息处理重点实验室副主任
个人简介:
期刊《计算机研究与发展》、《JCST》、《ACM ToMM》编委CCF多媒体专委会秘书长、中国人工智能学会智能服务专委会副主任、ACM SIGMM中国分会副主席、IEEE CASS北京分会副主席,主要研究方向是图像/视频等多媒体内容分析、多模态智能技术和视频计算,主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金重点等项目20余项,发表论文200余篇,获授权专利18项,技术应用到多个企事业单位中,先后获中国计算机学会科学技术奖、中国科学院青年科学家国际合作奖、CSIG自然科学二等奖、吴文俊人工智能自然科学一等奖、北京市科技进步二等奖。
本文由CAAI语言智能专委会供稿