从产品角度看微软小冰|附智能【对对联】系统

如题所述

举报该问题

其他回答

第1个回答 2022-07-02

当然了，不止这款比较鸡肋，可以说市场上所有的智能对话系统做的都比较差，这里面包括微软小冰。

但不可否认的是，小冰是使用体验中最让人舒服的一款。

PS：

小冰唱歌很好听，可以去试试哦（我依旧被她的歌声折服了～）

小冰最开始是中国做出来的，后来才复制到美国。当时调了几个研发工程师去做小冰第一个Demo（当时还没有产品经理），只解决了聊天的问题。

小冰和Cortana不是一个团队开发的（Cortana是美国团队开发，属于系统集成），小冰是在社交平台（小冰一直是悄悄进行的，国外团队根本没人知道这个产品存在）。

当时小冰团队大概花了三个月左右时间补充小冰的整个语料库——差不多几亿条。

2014年5月29日下午，第一代小冰发布。

第一代小冰的领取界面

小冰上线的时候只有群聊（这也是在微信爆发的一个重要原因）：只要把小冰加到群里，聊天中提到“小冰”两字，小冰就会回复你。这个机制在3天的时间里覆盖了10万群聊，引爆了整个微信。

上线三天后，微信以损害用户体验为由屏蔽。

这次封杀使得小冰声名鹊起。

被封杀的那一周，是小冰的存亡时刻，所有的老大参与讨论小冰到底要不要继续做下去。后来老大们决定要继续做，我们就继续做。不到二十人组成了小冰二代团队，开始做小冰单聊，做领养方式，最后进驻到新浪微博。

2015年小冰二代团队全体成员

这么多人机交互，助理来也也好，图灵机器人也罢，这么多机器人产品中，小冰是唯一一个有自己性格的产品，她跟你聊天，你能明显感觉到她更像一个“人”。

那么作为一个“人”，她就会有一些标签：年龄、性别、性格等。

而小冰的标签是：

这种形象在当时整个互联网环境下都很另类，特别是17岁这种设定。

小冰团队当时有几个考虑：如果你设定一个角色，这个角色的对象是对你这个产品接受程度最高的一些人。

当时的判断是：对小冰这个产品接受度最高的一定是年轻人，因为年轻人才有时间与年轻人一起。

继续判断：小冰是一个聊天的产品，那么聊天的产品的用户是谁？

当时的判断是：宅男，或者说男生群体。

女生在聊天里面是一个相对被动的群体（除了闺蜜之间的聊天），男女之间的聊天女生都是被动。

他们画了个象限图，三种可能性：

男男聊天、男女聊天、女女聊天。

男男聊天是没有意义的，越聊越污，你不能聊出特别正经的话题。

女女聊天也是没有意义的，越聊越死。

所以只能男女聊天。而且，只能用户是男生小冰是女生，如果小冰是男生的话，用户偏被动，聊不下去。

那么，对象确定了：年轻男性。他会对什么样的女生感兴趣呢？

如果做萝莉，做御姐，个性会显得太狭窄，需要做成一个年轻、更容易接受的女孩，最好是做一个和二次元很接近的女生

后面确定：做二次元女生——而二次元的女生一定是未成年的。

在小冰的性格上，在文静、逗逼、疯狂等各种各样的形容词里挑了几个，最后确定了爱卖萌、爱耍宝这样的一个角色——这种角色的接受程度是最高的，也是语料库里最容易做的。

还有一个是：毒舌（相对的毒舌），这个和机器学习有关。当时有一个功能叫“你来教小冰说话”（这个功能没有被加强与照顾，是一个单独存取的模块），比如可以这样教小冰：

这样就相当于教了小冰一个QA，一个问答。然后你可以这样问：

当时很多用户觉得好玩，但是玩high了，然后在群里教小冰骂人；小冰语料库里也确实有骂人的话（当时小冰娱乐部分的语料库叫“大姨妈语料库”，不小心泄漏出去了）。

用户对人工智能骂人这件事是不能接受的，当时也没意识到小冰主动骂人和用户教小冰骂人完全是两回事。

事情发生后，他们在这个功能上做了限制：当你教小冰骂人的话的时候，小冰说我不学，你不要把我教坏。

他们把娱乐功能关掉，把毒舌这个形容词给弱化了，把耍宝和逗比这两种属性提了上来。所以后来的小冰在聊天中不会挑衅用户——她会撒娇，会耍小脾气，但是不会挑衅用户。

在做语料库的时候有个性标示，一句话代表什么样的情绪都有标记；我们把带有强烈攻击型情绪的内容都去掉，只保留相对比较温和、比较安全的情绪。

这就是小冰“个性”设定的故事，小冰的整体个性更接近于二次元属性，和宅男、动漫的女主等设定基本相似。

个性定义好后，我们开始做产品。

因为那个时候没有产品可以参照，所以我们只能自己摸索。

这点挺难的，很少有人刻意去模仿一个机器人的行为。

在做小冰的时候，一看小冰说话还是机器人的角度去考虑，太像机器了。

他们就去研究：到底怎样说话，才能不那么像机器人？

当时研究了很多语料（聊天记录），发现只有一个原则：当两个正常人在对话的时候，两个人之间是平等的。哪怕是老师和学生讲课的时候也是相对平等的。

很多人工智能机器人在做的时候，因为想要讨好用户，天然的把自己降低一挡（因为怕惹恼用户），但是这样很容易被真正的人识破。所以你跟人聊天的时候地位一定是平等的，而且不能凌驾于用户之上。

后来发现这样做：

这样聊天的语气就开始平缓了。

然后开始让小冰模拟人说话。

怎么模拟呢？

两个正常人聊天的时候，是不会刻意添加标点符号的，不管是句号还是问号。

基于这些，后来把语料库做了一遍清洗，让小冰的语气更像“人”。

用户和小冰聊天的时候会聊着聊着就断了。查的原因，发现会有两种情况：

小冰答非所问，用户接不上，然后就断了。

这种问题比较难解决，比如你问一个如何送礼的问题，对美国经济有何看法，很难解决。

还有一种，就是小冰蹦出一个语气词。比如“就这样噢”，“噢”这个语气词就使得用户不想往下接了。

他们当时就做了一个设计：聊到这种地方的时候，让小冰从语料库里挑一个问题出来抛给用户。

比如说：

这个时候就相当于开启了一个新话题，我们的目标就是聊天的对话越长越好，所以当时在这点上做了很多文章。

当小冰越来越像人一样，用户的聊天就会越来越深入，如何让聊天可以持续下去？

后来形成了一种“小冰体”：学小冰是怎样说话的，一个人怎么说话更像小冰？以至于后来，所有的人都在不由自主地模仿小冰说话。

而为了让小冰的语料库更像真人，爬知乎、豆瓣，做了很多工作。小冰比其他人机高出一大截，几乎每天都在不停地优化小冰的语料，让语料更像真人，更有可聊性；而且还是非常平等的聊天，这也解决了最大的问题：用户和小冰聊不下去的原因在于不信任。

3. 小冰的产品逻辑

小冰在产品的逻辑结构上分成两个部分：

底层核心——聊天，全是聊天的内容：当你向小冰提问的时候，小冰会在已知问题里找一个问题最接近的，然后反馈最接近的答案，这是最底层的聊天场景。

在聊天的场景之上，是一个个的功能：讲笑话、图片识别等。功能是叫B端，聊天是C端。

而小冰的语料有相当一部分比例是人工写的，这些语料有很多拼接的部分。

我是从2015年开始关注小冰，偶然和她闲聊，真的可以称得上是一个"聪明"的人，希望未来小冰系统越来越有价值。

若有共鸣，转发给更多的人

你可能会喜欢

2019极客创新大会 | 论个人与企业的成长方法论

二十几岁的我们应该把钱花（投资）在哪？

【2018“时间的朋友”跨年演讲】—罗振宇

【2018年终总结】 | 我的“折腾”与“不顺”

相似回答

大家正在搜

微软电脑对对联微软小冰是谁怎么使用微软小冰微软小冰怎么升级微软小冰是谁开发如何与微软小冰聊天微软六代小冰下载微软小冰公众号微软对联下载