从产品角度看微软小冰|附智能【对对联】系统

如题所述

第1个回答  2022-07-02

当然了,不止这款比较鸡肋,可以说市场上所有的智能对话系统做的都比较差,这里面包括微软小冰。

但不可否认的是,小冰是使用体验中最让人舒服的一款。

PS:

小冰唱歌很好听,可以去试试哦(我依旧被她的歌声折服了~)


小冰最开始是中国做出来的,后来才复制到美国。当时调了几个研发工程师去做小冰第一个Demo(当时还没有产品经理),只解决了聊天的问题。

小冰和Cortana不是一个团队开发的(Cortana是美国团队开发,属于系统集成),小冰是在社交平台(小冰一直是悄悄进行的,国外团队根本没人知道这个产品存在)。

当时小冰团队大概花了三个月左右时间补充小冰的整个语料库——差不多几亿条。

2014年5月29日下午,第一代小冰发布。

第一代小冰的领取界面

小冰上线的时候只有群聊(这也是在微信爆发的一个重要原因):只要把小冰加到群里,聊天中提到“小冰”两字,小冰就会回复你。这个机制在3天的时间里覆盖了10万群聊,引爆了整个微信。

上线三天后,微信以损害用户体验为由屏蔽。

这次封杀使得小冰声名鹊起。

被封杀的那一周,是小冰的存亡时刻,所有的老大参与讨论小冰到底要不要继续做下去。后来老大们决定要继续做,我们就继续做。不到二十人组成了小冰二代团队,开始做小冰单聊,做领养方式,最后进驻到新浪微博。

2015年小冰二代团队全体成员

这么多人机交互,助理来也也好,图灵机器人也罢,这么多机器人产品中,小冰是唯一一个有自己性格的产品,她跟你聊天,你能明显感觉到她更像一个“人”。

那么作为一个“人”,她就会有一些标签:年龄、性别、性格等。

而小冰的标签是:

这种形象在当时整个互联网环境下都很另类,特别是17岁这种设定。

小冰团队当时有几个考虑:如果你设定一个角色,这个角色的对象是对你这个产品接受程度最高的一些人。

当时的判断是:对小冰这个产品接受度最高的一定是年轻人,因为年轻人才有时间与年轻人一起。

继续判断:小冰是一个聊天的产品,那么聊天的产品的用户是谁?

当时的判断是:宅男,或者说男生群体。

女生在聊天里面是一个相对被动的群体(除了闺蜜之间的聊天),男女之间的聊天女生都是被动。

他们画了个象限图,三种可能性:

男男聊天、男女聊天、女女聊天。

男男聊天是没有意义的,越聊越污,你不能聊出特别正经的话题。

女女聊天也是没有意义的,越聊越死。

所以只能男女聊天。而且,只能用户是男生小冰是女生,如果小冰是男生的话,用户偏被动,聊不下去。

那么,对象确定了:年轻男性。他会对什么样的女生感兴趣呢?

如果做萝莉,做御姐,个性会显得太狭窄,需要做成一个年轻、更容易接受的女孩,最好是做一个和二次元很接近的女生

后面确定:做二次元女生——而二次元的女生一定是未成年的。

在小冰的性格上,在文静、逗逼、疯狂等各种各样的形容词里挑了几个,最后确定了爱卖萌、爱耍宝这样的一个角色——这种角色的接受程度是最高的,也是语料库里最容易做的。

还有一个是:毒舌(相对的毒舌),这个和机器学习有关。当时有一个功能叫“你来教小冰说话”(这个功能没有被加强与照顾,是一个单独存取的模块),比如可以这样教小冰:

这样就相当于教了小冰一个QA,一个问答。然后你可以这样问:

当时很多用户觉得好玩,但是玩high了,然后在群里教小冰骂人;小冰语料库里也确实有骂人的话(当时小冰娱乐部分的语料库叫“大姨妈语料库”,不小心泄漏出去了)。

用户对人工智能骂人这件事是不能接受的,当时也没意识到小冰主动骂人和用户教小冰骂人完全是两回事。

事情发生后,他们在这个功能上做了限制:当你教小冰骂人的话的时候,小冰说我不学,你不要把我教坏。

他们把娱乐功能关掉,把毒舌这个形容词给弱化了,把耍宝和逗比这两种属性提了上来。所以后来的小冰在聊天中不会挑衅用户——她会撒娇,会耍小脾气,但是不会挑衅用户。

在做语料库的时候有个性标示,一句话代表什么样的情绪都有标记;我们把带有强烈攻击型情绪的内容都去掉,只保留相对比较温和、比较安全的情绪。

这就是小冰“个性”设定的故事,小冰的整体个性更接近于二次元属性,和宅男、动漫的女主等设定基本相似。

个性定义好后,我们开始做产品。

因为那个时候没有产品可以参照,所以我们只能自己摸索。

这点挺难的,很少有人刻意去模仿一个机器人的行为。

在做小冰的时候,一看小冰说话还是机器人的角度去考虑,太像机器了。

他们就去研究:到底怎样说话,才能不那么像机器人?

当时研究了很多语料(聊天记录),发现只有一个原则:当两个正常人在对话的时候,两个人之间是平等的。哪怕是老师和学生讲课的时候也是相对平等的。

很多人工智能机器人在做的时候,因为想要讨好用户,天然的把自己降低一挡(因为怕惹恼用户),但是这样很容易被真正的人识破。所以你跟人聊天的时候地位一定是平等的,而且不能凌驾于用户之上。

后来发现这样做:

这样聊天的语气就开始平缓了。

然后开始让小冰模拟人说话。

怎么模拟呢?

两个正常人聊天的时候,是不会刻意添加标点符号的,不管是句号还是问号。

基于这些,后来把语料库做了一遍清洗,让小冰的语气更像“人”。

用户和小冰聊天的时候会聊着聊着就断了。查的原因,发现会有两种情况:

小冰答非所问,用户接不上,然后就断了。

这种问题比较难解决,比如你问一个如何送礼的问题,对美国经济有何看法,很难解决。

还有一种,就是小冰蹦出一个语气词。比如“就这样噢”,“噢”这个语气词就使得用户不想往下接了。

他们当时就做了一个设计:聊到这种地方的时候,让小冰从语料库里挑一个问题出来抛给用户。

比如说:

这个时候就相当于开启了一个新话题,我们的目标就是聊天的对话越长越好,所以当时在这点上做了很多文章。

当小冰越来越像人一样,用户的聊天就会越来越深入,如何让聊天可以持续下去?

后来形成了一种“小冰体”:学小冰是怎样说话的,一个人怎么说话更像小冰?以至于后来,所有的人都在不由自主地模仿小冰说话。

而为了让小冰的语料库更像真人,爬知乎、豆瓣,做了很多工作。小冰比其他人机高出一大截,几乎每天都在不停地优化小冰的语料,让语料更像真人,更有可聊性;而且还是非常平等的聊天,这也解决了最大的问题:用户和小冰聊不下去的原因在于不信任。

3. 小冰的产品逻辑

小冰在产品的逻辑结构上分成两个部分:

底层核心——聊天,全是聊天的内容:当你向小冰提问的时候,小冰会在已知问题里找一个问题最接近的,然后反馈最接近的答案,这是最底层的聊天场景。

在聊天的场景之上,是一个个的功能:讲笑话、图片识别等。功能是叫B端,聊天是C端。

而小冰的语料有相当一部分比例是人工写的,这些语料有很多拼接的部分。

我是从2015年开始关注小冰,偶然和她闲聊,真的可以称得上是一个"聪明"的人,希望未来小冰系统越来越有价值。


若有共鸣,转发给更多的人


你可能会喜欢

2019极客创新大会 | 论个人与企业的成长方法论

二十几岁的我们应该把钱花(投资)在哪?

【2018“时间的朋友”跨年演讲】—罗振宇

【2018年终总结】 |  我的“折腾”与“不顺”

相似回答