首页 你的工程项目 1001+电子项目为您

能看书的智能眼镜

Ashwini Kumar Sinha著

350

艾菲测试了sani theo我们已经看到许多智能眼镜来探测物体之间的距离或帮助有视力障碍的人识别人脸。在这里,我们使用光学字符识别(OCR)将它扩展到下一个层次。将这个DIY项目扩展到下一个版本,我们现在正在详细介绍如何制造一种可以使用OCR和计算机视觉阅读文本的智能玻璃。玻璃前面安装了用于OCR和计算机视觉的摄像头,这样视力有问题的人也可以阅读。在这个版本中,你还需要一副护目镜。

先决条件

首先,我们需要安装项目所需的一些模块和库。由于智能玻璃是基于实时视频处理的,通过使用OCR,我们可以从可能包含图像的页面中提取文本。这里需要一个模块来从相机中捕捉图像。通过使用语音合成模块,可以将捕获的图像中的文本转换为语音。

首先,我们需要安装以下库:

  • OpenCV
  • PyTesseract
  • eSpeak

要安装它们,使用下面的命令:
Sudo apt-get install speak
Sudo apt-get install python- speak
安装opencv2

编码

将所需的库导入到代码中,然后设置保存视频帧用于文本提取的路径。

导入Python模块的代码段
图1:导入Python模块的代码片段
用于捕获视频并对其进行OCR处理的代码片段
图2:用于捕获视频并进行OCR处理的代码片段
测试代码
图3:测试代码

在代码中创建一个while循环,它将从摄像机捕获实时视频。使用cv2,将图像转换为BGR并保存到之前设置的路径。然后调用PyTesseract,它将打开保存的视频帧以处理图像并从中提取文本。通过使用eSpeak,语音引擎将把所有文本转换为音频并读取它。

作者的装置与相机连接在眼镜上
图4:作者的装置与眼镜上的摄像头相连
作者测试设备
图5:作者测试装置

请注意

如果想要声音输出清晰而又不呆板,你可以使用付费或其他文本语音转换服务,如gttts、watson speech等。
测试

将摄像机固定在眼镜上并运行代码。把书放在相机前,一动不动地等上几分钟,它就会自动开始读这本书。要听到它,请将您的耳机连接到树莓派耳机TRRS插孔或任何带放大器的扬声器。您还可以连接任何蓝牙耳机。

下载源代码


阿什维尼·库马尔·辛哈(Ashwini Kumar Sinha)是EFYi的电子爱好者和科技记者

没有评论

分享你的想法和评论

请输入您的评论!
请在这里输入你的名字

Baidu