| Sui's profileSui spaceBlogListsNetwork | Help |
|
August 24 人工智能--猜拳机器两年多前的一天,有幸和 xiaohu 及 peter 在Hamilton downtown的一所茶餐厅里讨论了基于欲望和记忆的人工智能。 两天前开始 xiaohu 和 Peter 开始写下讨论的内容。今天我也来作一点补充吧。 对于小虎和Peter已经用文字描述的思想我就不再重复了。 这篇短文的目标是通过一个例子使欲望-记忆型人工智能的idea更加清晰。 为了避免冗长的阐述,例子必须简单,而且跟生活比较贴近,所以我们将会描述一个玩 石头-剪子-布 的猜拳AI.
连续猜拳的时候,有人并不只是凭直觉伸手,而是会回想之前自己和对方都出过什么来决定自己这次应该出什么。如果这人记忆力和反应都特别好,可以记得并分析他跟对手连续猜拳的每一次结果和顺序,我会很有信心地预言他的胜率一定超过1/3。 当然了,我们必须假设出先后手等作弊伎俩不可能实现. 当然,如果只是做猜拳AI的话, 欲望-记忆型人工智能并非必要。 我们的目标是用这个简单例子来作为欲望-记忆型人工智能的一个框架雏形,所以我们会先设定一个让AI进行活动的世界,然后讨论这个AI怎样满足自己的需求。
假设我们创造了这样一个世界:
1. 没有空间的概念,因为没有有东西(包括生物)可以移动. 2. 有两个生物(A和B)以及一台裁判机器。生物的头连接到裁判机器上.生物不需要吃饭睡觉. 3. 生物可以给裁判机器发三种信息:石头(Hammer=H),剪子(Scissors=S)和布(Paper=P). 4. 生物每隔一分钟必须同时往裁判机器发一次信息,H, S或者 P.他们没有不发或者多发的选择. 5. 裁判机器会给赢了的生物放音乐(生物喜欢音乐),以及对输了的生物电击(生物不是被sm爱好者),平手没事发生。 6. 生物A有无穷的记忆力和无穷的思维能力. 7. 开始的时候生物A不知道输了会被电击,和赢了有音乐听. 8. 我们可以设置生物A的思考模式,生物B的策略是黑盒(black box). 我们将会用 HS 来表示生物A的石头对生物B的剪子,其余类推。
生物A的本能有两个:一是发出猜拳信号,二是回顾记忆进行分析。
在开始第一次猜拳的时候,生物A的状态如下:
愉悦集={音乐} 欲望集={} 记忆=<> 行为模式=<随机> 进行一段时间的胡乱猜拳后,生物A会开始发现赢了会带来音乐,而输了会带来电击,从而建立起欲望集:
愉悦集={音乐} 欲望集={(HS,音乐),(SP,音乐),(PH,音乐)} 记忆=<(HS,音乐), (SP,音乐), (SS,没事), (PS,电击),(PP,没事),(PH,音乐)> 行为模式=<随机> 再过一段时间,生物A的记忆够多了他可能会发现每次(SS,没事)之后,生物B总喜欢出布(Paper=P),这样他的行为模式就改
变了: 愉悦集={音乐} 欲望集={(HS,音乐),(SP,音乐),(PH,音乐)} 记忆=<...(SP,音乐), (SS,没事), ..., (HP,电击), (SS,没事),... (SP,音乐), (SS,没事),...> 行为模式=<(SS->S), 随机> Comments (4)
TrackbacksThe trackback URL for this entry is: http://inexist.spaces.live.com/blog/cns!9B7A9187694D140C!202.trak Weblogs that reference this entry
|
|
|