研究方向

数字文档处理技术研究

数字文档处理技术研究 研究室主页

数字文档处理技术研究方向自2000年以来,针对数字出版、电子公文等领域的数字化文档处理,开展数字版权保护技术(DRM)与普适性文档处理等相关关键技术的研究,先后承担了973、863、国家科技支撑计划、新闻出版重大科技工程项目、北京市自然科学基金、电子信息产业发展基金等国家与省部级课题;曾获国家科技进步二等奖1次、信息产业重大技术发明奖1次;已在国内外知名期刊和会议上发表论文40余篇,获授权发明专利20多项,其中有3项获中国专利优秀奖、1项获北京市发明专利奖二等奖。相关研究成果已经应用于数字出版领域,产生了良好的经济与社会效益。

数字文档处理技术研究方向主要围绕互联网(包括移动互联网)环境中数字文档的保护、描述、加工和展现中的相关问题,重点研究出版领域中的数字版权保护技术(DRM)与普适性文档处理技术,包括:

·数字版权保护技术

-数字版权保护支撑技术:密钥管理技术,权利描述与执行技术,DRM引擎防篡改技术。

-电子图书出版版权保护技术:电子图书安全分发与授权技术,DRM可信计数技术,电子图书离线借阅技术。

-面向多模式应用的版权保护技术:多硬件环境版权保护技术,网络内容细粒度授权与保护技术,网络内容对等安全传输与使用控制方法。

·普适性文档处理技术

-普适性文档技术:版式与结构化语义信息融合的文档格式描述方法,普适性文档的打包与压缩方法,文本图像压缩技术,跨终端的版面自适应呈现算法。

-文档结构信息抽取技术:包括版面分割、布局结构分析、版面对象定位与识别、阅读顺序与逻辑层次恢复、元数据自动提取。

-复杂版面识别:包括数学公式、化学分子式、表格等复杂对象的结构信息提取,以及漫画、报纸等复杂版面的识别。

·图形文档的管理与重利用技术,主要开展图形特征提取及描述方法、图形特征相似性度量方法、复杂图形识别技术等方面的研究。

已获得应用的主要科研成果有:

·研制面向电子书、电子报、电子杂志的平面出版物的DRM技术,在2003年被评为“信息产业重大技术发明”,其中的核心技术“具有硬件适应性的数字内容与硬件绑定的方法”专利获2008年北京市发明专利奖二等奖,并获2009年国家知识产权局第十一届中国专利优秀奖。

·研制了“基于数字版权保护的电子图书出版及应用系统”,获2009年度国家科技进步二等奖。基于该系统的“中华数字书苑”多次作为国礼被国家领导人在出访时赠送给国外科研机构或大学。

·基于普适性文档处理技术的研究成果应用于CEBX开放式文档格式标准,并研制了CEBX数据转换、跨平台阅读等系列软件,实现了小屏幕的移动终端上复杂版式的实时排版。

 

图表、公式等复杂版面在小屏幕的手机上自适应显示。 移动终端上拼音等复杂版面能自适应显示。

 

本研究方向目前有正式教职人员6人,其中正高职称1人、副高职称2人,研究生和实习生约20人。