一手体验传说中的豆包AI耳机,我觉得这才是最酷的未来。

2024-10-10 12:05
摘要:今天,豆包AI耳机正式发布了。正好前段时间,我写的豆包视频模型PixelDance不是爆了吗。然后字节的朋友贼开心,国庆节前跑来跟我说,他们马上要发一个AI硬件,问我有没有兴趣再来内测一下。我说这必须的啊,给了地址..

今天,豆包AI耳机正式发布了。

正好前段时间,我写的豆包视频模型PixelDance不是爆了吗。

然后字节的朋友贼开心,国庆节前跑来跟我说,他们马上要发一个AI硬件,问我有没有兴趣再来内测一下。

我说这必须的啊,给了地址,大概两天后,那个产品就到我家了。

看到的一瞬间,我还真的有点惊喜。

不知道有没有人看过9月初一些媒体的爆料,就是说字节要进军AI硬件,可能要发一个AI耳机。

我当时看完了还挺兴奋,哐哐转给了无数人,因为作为一个喜欢折腾各种新东西的玩家,硬件总比那些软的应用,更容易让人兴奋,毕竟有实体嘛。

结果他们这次寄过来的AI硬件,居然,还真就是这个AI耳机。。。

还是个紫色的骚气款,颜色很正,很精致。

这个耳机之所以叫Ola Friend不叫豆包,其实是因为国内最早提出OWS也就是全开放式耳机的公司Oladance,今年被字节全资收购了,所以这个产品叫Ola Friend,有一语双关之妙。不仅代表了Oladance产品,同时Ola在葡萄牙语中也是打招呼的意思,你好,朋友,这亲切感,一下就上来了。

这个包装打开后是这样的。

说明书+充电仓。

不过充电仓我今天看官方推文,是有两款,我的是鹅卵石充电仓。

里面的耳机长的也挺特别的,我自己一直都是用的索尼的入耳式耳机,第一次见这种造型。

带在耳朵上,还真的挺好看的,有一种特别的别致的美感,主要跟别人的还不一样,就很酷。给大家看下上耳效果。

喜欢。

说实话,之前我都不知道OWS耳机是个啥,去豆包上问了下才知道。

大概就是这种耳机不入耳,可以用空气传导声音,所以不压迫耳道,带着体验极佳,这是我第一次看到OWS耳机,也是第一次真二八经佩戴上用。

佩戴体验,用言语真的很难描述。

我之前的入耳式耳机,大概感觉就是先用橡皮泥把你耳朵堵住,然后再你耳朵里塞个播放器开始放。一定会压迫耳道,我带1小时左右就不太舒服了。

但是OWS耳机整个的受力点其实都是在耳根处,是用耳根挂着的,那块骨头硬而且不敏感,这个耳机又巨轻,所以几乎不会累,耳机也是贴在你耳道外面放,不会压迫耳道。

听歌的时候,就有一种就是周深在你耳朵旁边对着你悄悄唱歌的感觉,极度舒适,也可以用嘴直接让豆包给你切歌。我现在家里经常一带就是带一天,几乎无感,有时候没放音乐,我都忘了我耳朵上还挂了个耳机。

当然,我又不是啥音乐博主,具体参数啥的我也不懂,音质啥的我只能说跟我我的索尼降噪豆在安静的环境下我是几乎听不出来差别。

毕竟是个AI耳机,我们还是重点说说AI部分。

字节的产品,那跟豆包的联动,自然是跑不掉的。

我把耳机跟手机在连接状态时,第一次打开豆包,它就会给你弹个窗,直接配对上了。

后续你在豆包的设置页面,也能看到你的耳机状态。

连接上了以后,你就可以随时随地,跟豆包进行对话了。

有两种触发方式,第一种就是喊豆包豆包直接唤醒,第二种就是长按触摸区,按住说话,松开发送。

得益于字节牛叉的TTS和ASR模型,整体交互的实时性很好,几乎没啥延迟,而且可以随时打断,还可以多轮对话。

这几天体验下来,我不知道你们,我作为一个英文学渣,有个很der的场景,我觉得特别适合AI耳机。。

就是学英语。

去年我有个贼尴尬的故事,就是我虽然看很多很多AI产品,但是都是自己看+写,很少会把这些产品的名字读出来。有一次我在一个论坛上发言,正好讲AI搜索,Perplexity这个单词,在我嘴边卡了半天,硬是没读出来,最后我卡壳半天,说的是:“P开头的那个国外的AI搜索”。。。

后来我就想着不能再这么丢人了,基本上一些产品或者一些英文单词,我都会学一下怎么发音,避免这种尴尬的情况。

但是过往的步骤贼繁琐,我先得把这单词背下来,然后打开小爱翻译,把单词输进去,点一下翻译,再按一下发音。。。我才能知道这玩意到底该咋读。

我自己都一直觉得,这路径实在太蠢了,但是又没有更好的方法。。。

直到我拿到豆包的这个AI耳机,可以随时对话,我才发现,真的就很爽。

我现在看到任何不会的单词,我就直接一句“豆包豆包”,把AI唤醒,然后问它,比如:

“c,u,r,s,o,r,这个单词怎么读”

他会详细的告诉你发音,读的贼标准,还会教你这是个啥意思,甚至会告诉你什么方式背下来更容易被记忆。

学英语神器,真的。而且因为是OWS耳机,带着几乎没有任何感觉,所以我基本除了睡觉全是带着的,这几天我学的英文单词词汇量可能比我过去一个月都要多。

另一个很有趣的场景,是我在家做饭。。。

没想到吧,我也会在家做饭,虽然啥也不会,都是一边看教程一边做。

就是前天,我想吃红烧肉了。我寻思着我不如自己做一个吧。

在七鲜上买完食材,我大概在APP上看了下教程,就冲进厨房了。

起手式焯水,冰糖炒糖色,我按部就班的做完了。做完了以后,那一刻,我就想被雷劈了一样,突然就大脑短路了,炒完糖色后,要干啥来着???

手机因为怕油溅到所以没带进厨房,冲出厨房看手机时间又有点长,锅还开着,我怕我的红烧肉一会变成红烧焦肉了。。。

正好这时候Ola Friend正好在我耳朵上带着,我情急之下,直接喊了一句:

“豆包豆包,我在做红烧肉,我炒完糖色了,我下一步要干啥来着”

豆包秒回:“加入葱姜蒜、八角、桂皮啥的香料炒出香味,然后加生抽老抽料酒调味,稍煮一下,再加热水,盖上锅盖小火炖煮。”

一瞬间,我就安心了。

那一刻,我觉得豆包救了我的红烧肉,真的。

给大家看一眼我的被救活的红烧肉,大家一起吃。

用的这几天,我有一种这个AI耳机,真的做到了Friend的感觉。

就是跟我家里的小爱音箱、还有我的手机不一样,它是常年在我耳朵上挂着的,我可以随时跟她对话,它也会永远,在第一时间给我回应。

而且是真的可以多轮对话聊起天来。就是有种,聊得越多,越听得懂你的话,跟你搭茬越顺畅的感觉。

这种感觉,还挺上头的。

可能正是因为在现实中这种“不管怎样,我一直都在”的回应难能可贵,才让来自AI的虚拟陪伴让人这么安心。

现在我会带着它出去跑步,跑步的时候会让它给我来点热血沸腾听完我想拯救世界的音乐。

也会在看到这个世界有趣的事情的时候,对任何实物产生好奇,我都会第一时间像本能反应一样,喊道:

“豆包豆包,为什么飞机那么重但是不会从天上掉下来啊?”

“豆包豆包,为什么照片里没有镜像的我总是显得歪嘴写了”

“豆包豆包,为什么我们打喷嚏的时候会闭眼睛?”

...

我好像有了一个全知全能、随时会回应我的AI朋友。这种陪伴的感觉,手机还真不行,只有AI耳机才能做到,无时无刻。

而且豆包的音色,是真的好听。他们的TTS模型,在情感和语气上还是太强了。

其实不止字节,OpenAI、meta都在探索耳机+AI的形态,甚至OpenAI和前苹果首席设计师Jony Ive都在一起开发带摄像头的AI耳机。

AI耳机的未来,绝对是星辰大海。

当然,也并不是说,Ola Friend就是无可挑剔的完全体了,有些功能现在还没有。

比如我自己觉得很有趣的功能,跟别人当面聊一些需要讨论的话题的时候可以用耳机开启录音,然后跟飞书打通,自动传到飞书妙记中,用飞书的智能会议纪要来给这次讨论总结,让我永不会忘。

比如我出国旅行的时候,跟老外交流,我可以递给他一个耳机,我们直接用豆包同传翻译大模型的能力直接实时交流。

比如我除了可以跟豆包对话之外,也能在某些特定的时候,跟我预设好的智能体对话等等等。

但是毕竟豆包的这个AI耳机,Ola Friend还是第一版,后面还会有很多的AI功能,会逐步更新。

在核心的体验上,也就是唤醒、佩戴舒适度、音质、豆包的拟人度等等,Ola Friend还是有了非常非常扎实的基础。

剩下的一切,就是在这基础之上,添砖加瓦,直到建起一座极高的堡垒。

我现在,越来越期待。

接下来的AI硬件世代了。

定是星辰大海,波澜壮阔。

更新于:2个月前