Images to Text——OCR? NO! Describe images!!——神奇的图像识别工具

说的Images to Text,我们一般想到的就是OCR(Optical Character Recognition,光学字符识别),然而这次的Images to Text是一种更为高级的存在——图像识别系统!!

Images to Text是由多伦多大学的Toronto Deep Learning group开发的一款开源图像识别系统,它可以辨识用户所上传的图片上的内容(原理是基于深度学习吗?好神奇),也就是说它可以描述图片上的内容(如图1所示,成功的识别了图像的主体,但细节仍存在问题)。试用起来感觉还是很神奇的,然而在一些复杂的图形或是二次元图形下,它的表现就差强人意了(如图2所示,将狂三识别成了什么?无头雕像……),准确性还是较低的。

i2t-1

图1

i2t-2图2

Demo:

http://deeplearning.cs.toronto.edu/i2t

Source code:

http://deeplearning.cs.toronto.edu/codes


与Images to Text在一起的还有一个Image Classification——图像分类系统

http://deeplearning.cs.toronto.edu/

发表评论

电子邮件地址不会被公开。 必填项已用*标注