智能终端及可穿戴智能设备的出现,极大方便了用户获取外界的信息,并以语音,文本,图像等形式存储和传输。社会网络成为用户分享生活中工作中信息的平台。媒体大数据的管理与检索是一个重要的问题。如何依托现在的智能终端快速地检索出相关信息是一项迫切需要解决的问题。我们对于图象视频多媒体内容分析、检索管理等技术进行了较为系统深入的研究工作。
1) 提出一种基于压缩域中的字幕提取、定位和跟踪方法,以及一种利用关键点特征的字幕检测、定位、跟踪和分割方法。
2) 在视频摘要和视频浏览方面提出一种基于感知特性的视频浏览框架和一个可扩展的视频摘要系统。
3) 在图像视频检索方面,提出一种改进的SIFT 特征和一种改进的LBP 特征,一种分级抽样特征聚类方案,一种目标的特征空间一致性判定方案,建立了一个图片检索系统以及一个视频媒体复制检测系统。
4) 基于智能终端的可分级检测方法。通过挖掘拍摄图像上下文相关语义信息,达到判别特征对检测的贡献度,达到减少数据量及提升。
5) 基于媒体大数据分析的商品质量评分及用户认知对智能城市信息管理及用户个性化服务推荐奠定了基础。
研究成果 在国内外知名期刊和国际会议上包括IEEE Transactions on Circuits and Systems for Video Technology,IEEE Trans. Image Processing和IEEE Trans. Multimedia发表论文数十篇,申请专利10余项。