奔跑吧,AI当你的眼睛
谷歌表示,它开发了一个人工智能系统,可以帮助视力受损的人独立运行。据报道,依靠该系统,视力受损的人不需要依靠人类的指导,也不需要引导狗狗自己完成全程。那么,这个人工智能系统如何让视力受损的人参加跑步比赛?近年来,帮助视力受损的人恢复视力,人工智能的周期性成就是什么?这些产品与目前的应用程序有多远?
用声音信号指引盲人的道路
如今,许多健身倡导者喜欢挑战马拉松,盲人如何参与跑步?"半匹马"或"整匹马"?一位公共福利组织者说,盲人参加这样的比赛需要跑步者的帮助。为了便于跑步,盲人和随行跑步者之间有一根绳子,他们的手腕上都缠着,就像他们手牵手一样。为了确保盲人在跑步时是万无一失的,有时需要两名跑步者。然而,当盲人通常训练的时候,在任何时候找到一个随行跑步者似乎是不现实的。
最近,许多城市开始允许导盲犬进入地铁和公共汽车。然而,在中国,导盲犬的数量是非常有限的。据统计,截至2017年,导盲犬的数量只有116只,比大熊猫还少,同时有800万视力受损的人需要导盲犬服务。每只导盲犬的训练费用在120000到150000美元之间。导盲犬的寿命大约是十多年。即使视力受损的人幸运地安排了一次,这也是一个值得思考的问题,即有视力障碍的人退休后应该如何外出。
谷歌开发的这个系统似乎给了我们希望。"在这个系统中,视力有缺陷的人不需要依靠人工向导或导盲犬独自完成旅程。"智库人工智能主管、图灵机器人公司首席战略官谭明洲说。
应用程序使用人工智能模型来识别道路上的一条线,并根据应用程序推断出跑步者与直线之间的关系。如果跑步者太远,应用程序会向戴着耳机的骨头耳机发送信号,播放令人不快的噪音。哪个耳机发出声音,声音有多大,让跑步者知道自己需要移动到哪里,以及离终点线有多远。
谭明洲解释说,这有点像汽车上使用的接近警报器,汽车离发生碰撞的地方越近,警报器就越响,频率也就越快。使用谷歌的系统,跑步者需要在腰带上系上Android手机。这个应用程序不需要连接互联网就能工作,它还可以考虑各种照明和天气条件。显然,如果在某些社区,特别是为视觉残疾者设置带有引导标志的轨道,他们可以安心地跑步和锻炼。
构建一个无障碍的场景,如您所见
有视力障碍的人只是看不见的,可以被听到。谭明洲指出:"目前的人工智能技术使得他们不可能真正看到世界,但它让他们能够体验"仿佛他们看到了的效果。
如今,许多互联网公司已经成功地让视力迟钝的人能够以多种方式与他们提供的服务进行互动,主要是通过将文本转化为屏幕阅读器的声音。四年前,Facebook(Facebook)推出了"无障碍倡议"(Accessability Initiative),试图利用人工智能技术丰富盲人、聋人和其他残疾人的用户体验。关键任务之一是重新设计菜单和按钮结构,使用自动解释特定照片和视频的算法,以便为屏幕阅读器提供丰富的场景描述。
作为美国的一名职业徒步旅行者,视力迟钝的特雷弗·托马斯(Trevor Thomas)偶尔会和他的狗在一些山路上和粉丝们在Facebook上分享徒步旅行的照片和视频。我不在乎是否使用Facebook,因为我看不见照片,"他说。"但现在我无法想象没有Facebook的一天。"例如,人工智能技术的屏幕阅读器描述了旧金山湾日落的照片:它包含自然、室外、云、草地、地平线、植物或树木;一对夫妇站在加州丹麦一家著名的风车前,解释说这张照片包括三个人,微笑和户外。
很明显,这些解释并没有提供对照片的全面描述,但是没有人的帮助,它们确实填补了一些空白。谭明洲说:"视力受损的人只需要点击读者来描述他们,而不需要其他人来解释。
瑞士EYRA公司开发了一种用于视力障碍患者的阅读辅助设备。据报道,该设备由三部分组成:耳朵上悬挂的骨传导耳机和高清摄像头,以及人工智能处理器。人工智能处理器可以将文本转换成音频小说,当然,也不需要担心噪音干扰,因为它是骨骼传导,可以在一定程度上减少噪音干扰,给视力受损者的生活带来方便。
今年在拉斯维加斯举行的世界上最大的消费电子展上,智能手机可以通过声音谈论周围的世界,为视力残疾和弱视用户提供更丰富的视觉体验。"该应用程序还可以适应智能眼镜,它可以将用户的智能手机摄像头变成用户的眼睛。据报道,它使用人工智能识别摄像机指向的视觉信息,包括食品包装、海报和展示屏幕,如超市商品信息、车站展示屏幕、街头海报等。此外,你还可以识别朋友和家人的脸,用户可以用它们来扫描和发现周围的人和东西。
努力从三个方面释放科技人文关怀
根据美国劳工部和美国盲人联合会的统计,147个视力障碍者的职业可以成功就业,因此,有学者指出,教育是改变视力障碍者就业状况的关键一步,特殊教育也需要技术化。
目前,许多针对弱智者的解决方案突出了人工智能应用的多样性和人性化。那么,如何加快人工智能产品的突破性使用,从而使冷技术释放出人文关怀呢?
谭明洲指出,这需要三方面的努力。首先,我们应该培育创新的生态。在2017年德勤国家创新精英挑战总决赛上,四川大学一组学生开发的一款视觉致残Kindle阅读器获得了该奖项。我们应该鼓励更多这样的科技成就,为视力有缺陷的人进行创新,让他们睡不着觉,并尽快把他们变成真正有益于视力缺陷的人的产品,"谭明洲说,"我们需要建立一个良好的创新环境。
此外,应解决计算能力与成本之间的矛盾。谭明洲说,机器学习和训练经常消耗大量的计算能力,在操作中会存在信息隐私的时间延迟和安全风险,这就需要将数据从人工智能算法上传到云端。为了满足终端人工智能推理操作的实时性和可用性要求,需要对大量的数据进行局部处理。然而,如果在终端本身部署高性能的AI芯片,从成本控制的角度来看是不现实的,在实体场景中部署足够多的EDGE AI更可行。
边缘计算可以被看作是对5G/AI+云计算的巨大帮助"--"神经末梢"。例如,AI向导坚持实现实时的交互和判断,看到交通灯变绿,就可以自动判断出"可以"的状态。使用边缘计算无需通过云服务器逐层判断将路灯信息上传到云端,从而发送步行提醒。这无疑大大降低了延迟的风险,以及云计算的过载。
最后,我们还需要等待工业环境的全面成熟:基础设施、硬件和软件的改进基本到位,以便终端设备能够更好地运行深度学习算法。"加强5G智能网络的建设,确保云计算和边缘计算各节点的高效可靠使用。"谭明洲指出。