移动设备上图象拼接研究与虚拟鼠标实现

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:a272437762
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动终端软件和硬件的发展,计算机视觉技术在移动设备上的应用逐渐变成可能。视觉技术与移动终端的结合是一个重要的技术体现。目前已经有很多这方面的系统,比如手势识别,人脸识别等都有在手机上应用的例子。计算机视觉在移动设备上应用的局限性在于对图像的计算量很大,并且需要摄像机支持,对cpu的计算能力和手机电池的容量都有很高的要求,目前只有少数高端的智能手机能满足这方面的需求。我们的工作也是基于智能手机平台展开的。   本文主要贡献体现在两个方面:   本文的第一个工作是一个手机图像拼接系统,这个系统极大的扩展了手机摄像机的功能,它可能把摄像机拍摄的图像序列拼接成一幅全景图。尤其对于拼接文本更加实用。当用户看到一篇有用的文档时有时需要把它保存下来,可是摄像机很难清晰的把这样的一幅图像完整的拍摄下来,使用图像拼接功能我们只需要像扫描机一样使摄像机连续的在文档上移动,采集图像序列,拼接后的结果将是一幅表示整个文档的全景图。在这个工作中,我们使用了非常稳定的图像特征点算法,和快速的基于高维空间搜索数结构的特征点匹配算法。提高的拼接算法的精确性和速度。   第二个是利用对摄像机进行运动估计的方法在手机上实现了虚拟的鼠标。该方法利用了手机摄像机采集的视频数据实时的算出摄像机的位移量,从而可以驱动虚拟鼠标在手机屏幕菜单上移动,实现了鼠标功能。在这个工作里,我们采用了一些方法提高了计算速度,使得系统能基本上达到实时。本工作的贡献在于第一次提出了虚拟鼠标的概念,并提出了快速算法使得该系统能在计算能力有限的手机上做到实时。
其他文献
在考古发掘过程中,发掘人员主要采用传统工具取土。为更好地保护文物,在无法确定文物的具体位置、大小和埋深的情况下,发掘人员只能小心翼翼逐层(几个厘米)取土。这样工程进度缓
本文结合频闪成像技术和相移显微干涉技术,建立了MEMS-DMs静态及离面运动测试系统,提出新的用于恢复离面运动信息的双向相位展开算法,提出了基于可靠性的相位解缠算法,并实现对可
脑与计算机界面(Brain Computer Interface(BCI)),一项正在兴起的技术,给我们提供了一种新的交互界面。这种技术可以把我们的大脑活动转化为控制信号来控制计算机,机器人等外部
网络化制造业为企业快速响应市场、降低成本、提高核心竞争力提供了有利条件,成为现代制造系统的发展趋势。然而,它也为企业传统的生产管理与控制问题,包括调度方法提出了很
在移动机器人目标跟踪领域,粒子滤波是常用的目标运动估计算法之一。传统粒子滤波器通常使用单一的运动模型,无法适应目标在多种运动模式下的跟踪问题。本文通过提取目标运动过
在网络服务质量路由研究中,基于多个约束条件建立的网络模型可以更准确地反映实际的QoS路由选择问题。这种多约束条件的网络服务质量路由问题是寻找同时满足两个以上路径约束
本论文涉及的科研课题来源于航天某研究所,论述了用于某武器性能测试的目标模拟二维运动控制系统的工程设计和关键技术问题的研究。论文首先介绍了二维运动支架的机械结构组
学位
随着微处理器技术和电力电子技术的发展,设计基于先进控制策略的全数字交流异步电动机调速控制系统变得更为方便。交流调速控制一直是自动化领域内一个重要的研究领域,而在异步
互联网是当今最大的信息资源库之一,其信息发布的及时性与全球互联性使得其对整个社会的发展起着巨大的影响。由于互联网相关技术飞速发展,它已经影响到了日常生活的方方面面,对