Sui's profileSui spaceBlogListsNetwork Tools Help

Blog


    August 24

    人工智能--猜拳机器

    两年多前的一天,有幸和 xiaohupeter 在Hamilton downtown的一所茶餐厅里讨论了基于欲望和记忆的人工智能。 两天前开始 xiaohu 和 Peter 开始写下讨论的内容。今天我也来作一点补充吧。 对于小虎和Peter已经用文字描述的思想我就不再重复了。 这篇短文的目标是通过一个例子使欲望-记忆型人工智能的idea更加清晰。 为了避免冗长的阐述,例子必须简单,而且跟生活比较贴近,所以我们将会描述一个玩 石头-剪子-布 的猜拳AI.
     
     
    连续猜拳的时候,有人并不只是凭直觉伸手,而是会回想之前自己和对方都出过什么来决定自己这次应该出什么。如果这人记忆力和反应都特别好,可以记得并分析他跟对手连续猜拳的每一次结果和顺序,我会很有信心地预言他的胜率一定超过1/3。 当然了,我们必须假设出先后手等作弊伎俩不可能实现. 当然,如果只是做猜拳AI的话, 欲望-记忆型人工智能并非必要。 我们的目标是用这个简单例子来作为欲望-记忆型人工智能的一个框架雏形,所以我们会先设定一个让AI进行活动的世界,然后讨论这个AI怎样满足自己的需求。
     
    假设我们创造了这样一个世界:
    1. 没有空间的概念,因为没有有东西(包括生物)可以移动.
    2. 有两个生物(A和B)以及一台裁判机器。生物的头连接到裁判机器上.生物不需要吃饭睡觉.
    3. 生物可以给裁判机器发三种信息:石头(Hammer=H),剪子(Scissors=S)和布(Paper=P).
    4. 生物每隔一分钟必须同时往裁判机器发一次信息,H, S或者 P.他们没有不发或者多发的选择.
    5. 裁判机器会给赢了的生物放音乐(生物喜欢音乐),以及对输了的生物电击(生物不是被sm爱好者),平手没事发生。
    6. 生物A有无穷的记忆力和无穷的思维能力.
    7. 开始的时候生物A不知道输了会被电击,和赢了有音乐听.
    8. 我们可以设置生物A的思考模式,生物B的策略是黑盒(black box).
     
    我们将会用 HS 来表示生物A的石头对生物B的剪子,其余类推。
     
    生物A的本能有两个:一是发出猜拳信号,二是回顾记忆进行分析。
     
    在开始第一次猜拳的时候,生物A的状态如下:
      愉悦集={音乐}
      欲望集={}
      记忆=<>
      行为模式=<随机>
     
    进行一段时间的胡乱猜拳后,生物A会开始发现赢了会带来音乐,而输了会带来电击,从而建立起欲望集:
      愉悦集={音乐}
      欲望集={(HS,音乐),(SP,音乐),(PH,音乐)}
      记忆=<(HS,音乐), (SP,音乐), (SS,没事), (PS,电击),(PP,没事),(PH,音乐)>
      行为模式=<随机>
     
    再过一段时间,生物A的记忆够多了他可能会发现每次(SS,没事)之后,生物B总喜欢出布(Paper=P),这样他的行为模式就改
    变了:
      愉悦集={音乐}
      欲望集={(HS,音乐),(SP,音乐),(PH,音乐)}
      记忆=<...(SP,音乐), (SS,没事), ..., (HP,电击), (SS,没事),... (SP,音乐), (SS,没事),...>
      行为模式=<(SS->S), 随机>
     

    Comments (4)

    Please wait...
    Sorry, the comment you entered is too long. Please shorten it.
    You didn't enter anything. Please try again.
    Sorry, we can't add your comment right now. Please try again later.
    To add a comment, you need permission from your parent. Ask for permission
    Your parent has turned off comments.
    Sorry, we can't delete your comment right now. Please try again later.
    You've exceeded the maximum number of comments that can be left in one day. Please try again in 24 hours.
    Your account has had the ability to leave comments disabled because our systems indicate that you may be spamming other users. If you believe that your account has been disabled in error please contact Windows Live support.
    Complete the security check below to finish leaving your comment.
    The characters you type in the security check must match the characters in the picture or audio.

    To add a comment, sign in with your Windows Live ID (if you use Hotmail, Messenger, or Xbox LIVE, you have a Windows Live ID). Sign in


    Don't have a Windows Live ID? Sign up

    Yang Liwrote:
    we need your original.  
    Aug. 27
    Sui Huangwrote:
    有道理.
    内存方面在搞理论的时候或许可以放一放, 先假设内存无限大并且运算无穷快.
    不过真的到了要开发实现就必须考虑了.
    解决方法一: 只保留recent 的记忆
    解决方法二: 用一些数据结构来把历史抽象化,比如只记下对方出石头的百分率之类的
    这些解决方案好不好还有待验证
    Aug. 24
    Picture of Anonymous
    王小虎 wrote:
    再迟一点我们还应该加上失忆的功能,以保证记忆不会缓冲区溢出。这样即使 4GB 的小内存(人工智能里 4GB 算很小了)也可以实现一定的人工智能,虽然这样的人工智能可能连蚂蚁都比不上。
    Aug. 24
    Sui Huangwrote:
    忘了说这个例子的limitation 了。
    1. 猜拳还要回避电击,就应该有一个跟愉悦集相对应的痛苦集,不过也忽略了。
    2. Peter 的文章里提到过,逻辑技能其实也是基于记忆,但是在这个例子里简单起见我把分析能力归为本能了。
     
     
    Aug. 24

    Trackbacks

    The trackback URL for this entry is:
    http://inexist.spaces.live.com/blog/cns!9B7A9187694D140C!202.trak
    Weblogs that reference this entry
    • None