智能眼镜
我们正在开发一副可以实时进行智能翻译的眼镜,这对一个不懂当地语言的旅游者来说,是非常有用的。让我们想像一个外国人正在他旅行期间使用可穿戴的智能翻译眼镜。眼镜能告诉他某建筑物是一间旅馆, 一家餐馆,一个银行,或是一家自选市场,能翻译公共汽车线路的情况,能帮助理解道路标志和饭店的菜单,这些将会使他的旅程变得更加愉快。
系统由一个微型摄像头、一部可穿戴的计算机和一个头戴式显示器组成。它们采集图像信息,进行翻译并最后显示文字结果。借助不同的光学文字识别(OCR)系统和翻译系统,我们能灵活地对其进行配置,来完成对不同语言的翻译。
这副聪明的眼镜具有下面的特征:
(1)翻译:眼镜能翻译在摄像头的视野中出现的文字信息;
(2)速度快:文本提取、识别、翻译和显示这一过程大约需要三秒;
(3)可穿戴:机器很轻巧,可以方便地携带在身上。
项目的难点在于从图像中准确地提取文字。一个新颖的以文字特征为基础的文字提取算法很好地解决了这个难题。即使摄像头获取了一个非常模糊的图像,也能准确地提取出正确的文字字串。