在AI与信息交互之间:QQ 浏览器的边界探索
互联网1.0时代,网络是人们查阅资料、了解世界的重要窗口,这个时期人与信息的关系是单向的,信息如一本本静态的电子化书本需要用户触及后再阅览获取;互联网2.0时代,互联网开始成为人们获取价值信息和社交不可或缺的重要工具,人与信息的关系开始有了双向的交互,信息与人共同编织、丰富着这张时代大网
互联网1.0时代,网络是人们查阅资料、了解世界的重要窗口,这个时期人与信息的关系是单向的,信息如一本本静态的电子化书本需要用户触及后再阅览获取;
互联网2.0时代,互联网开始成为人们获取价值信息和社交不可或缺的重要工具,人与信息的关系开始有了双向的交互,信息与人共同编织、丰富着这张时代大网。
随着推荐技术成熟以及信息流业务急速扩张,用户与内容的交互模式逐渐从“人找内容-搜索”向“内容找人-推荐”迁移,并且这种趋势仍在扩大它的外延。搜索作为人与内容信息交互的一种重要方式,它的作用并没有削弱,用户在推荐场景的沉浸消费反而会激发出新的搜索需求。
从本质上看,搜索与推荐关注的交汇点都是交互的核心——用户兴趣,因此如何在当前信息分发场景中更好满足用户兴趣是一个重要命题。而浏览器是用户在互联网2.0时代与世界交互信息的重要入口,也是展示搜索与推荐技术精进的绝佳观察点。
浏览器作为一款综合性APP,承载了搜索、信息流推荐、小说等多种用户消费信息的场景。这些场景都有大量的内容理解、内容生成方面的AI需求。不同的场景都有各自的特点,比如搜索的Query意图分类、信息流的内容推荐、小说的内容分类等。
这些特点也让浏览器成为全面观察AI技术在自然语言语义理解方向发展很好的窗口,跟随推荐技术的发展脉络,我们发现腾讯旗下的QQ浏览器应用月活用户已经超过4亿,俨然成长为浏览器中的超级APP。
在国内,腾讯是较早大规模实践AI推荐技术的厂商之一,旗下的QQ浏览器过去几年来在AI和推荐技术方面经历了几次大规模重构和迭代,现在已经蔚然成森。这几年QQ 浏览器在技术层经历了怎样的厚积?在信息茧房和视频化难题的泥沼中,QQ 浏览器做出了哪些选择?其实战经历对于浏览器行业来说,还是具有一定的学习和参考价值的,值得我们探讨一下。
信息流“沼泽”中QQ浏览器面对的选择
在浏览器中,信息流主feed是图文、短视频、小视频混合形态,这也是推荐算法应用的主场景。在这些场景中,浏览器在不断发展的进阶过程中容易遇到这些痛点难题:
1.信息茧房现象。内容和资讯类平台不光要推荐热门的信息内容,也面临解决一些初始信息的冷启动问题,推荐系统如何公正有效的推荐优质内容,使得好内容获得更多的曝光机会,触达更多的人群。
2.面对具有丰富场景的浏览器,其背后的AI研发需求多样复杂,传统的研发模式研发周期长,效率低。比如内容视频化方向,怎么打更好的标签以及做更好的多模态,对视频的理解和多模态的理解如何做到准确把控等。
3.细分场景的多样化与精细化运营的需求,信息流目前发展到了精细化运营的阶段,需要针对多种多样的细分场景进行敏捷优化。
无论是对于用户来说,信息内容的茧房现象带来的一亩三分地的局限“视野”,还是企业面临的形态复杂、内容多样化进阶的AI技术需求等,这些对信息流内容产生影响的挑战都亟需解决,为内容信息的获取和交互还一片轻快的价值体验。
QQ浏览器在面对上述挑战中,选择运用预训练+finetune+AutoML的新范式和多目标多场景联合优化的新深度模型等创新来应对信息流这方面的技术挑战。在腾讯QQ 浏览器举办的AI算法大赛中也可以窥视到多模态技术与超参数对这些浏览器难题的优化,这两个技术也是此次比赛的两条赛道。
比如在视频流的场景中,多模态的技术可以根据视频观看的时间及关注的兴趣及行为让下一个视频更符合、相似目前观看的视频,在语义上的相似可以让用户的体验更好。QQ 浏览器在多模态技术中也做了评价视频语义相似度的问题,可以更精确地评价两个视频的文本区别,为用户不再推荐重复的内容,增强在推荐方面的泛化和兴趣探索的能力,很好地缓解信息茧房的问题。
而超参数技术可以实现多目标融合,也就是在推荐系统中,从刷视频的点击率演进到点击、关注、点赞等同时完成,超参数搜索把以前人工寻参的方式通过网格搜索、非个性化寻参到个性化寻参的方式提升效率。在腾讯QQ浏览器实践过程中可以减少 80% 以上的寻参时间,大大提升了推荐系统的研发效率。
我们知道浏览器在实际的推荐和搜索业务场景中,有异常丰富且持续演化的内容需求,这些庞大的内容数据并没有客观清晰的定义,数据标注也就成为内容算法研发的核心瓶颈,而预训练大模型是解决这一问题的“良药”。
聚焦推荐与搜索:当浏览器拥抱大模型
预训练大模型也是近两年AI产业中最火的关键词之一。目前比较有名的模型参数量都已经达到万亿级别了,应用场景差异也比较明显。以 OpenAI斥巨资打造的GPT-3为例,它依然是偏 NLP 的模型。在AI大模型的探索上,无论是着眼于提升超大规模AI算力,还是突破学术前沿的角度,本质上都是通过将海量的数据进行预训练、预集成,形成高鲁棒性、低样本量需求的大模型。企业可以根据自身的应用场景,在大模型的基础上进行少量的调参即可完成落地。
而浏览器与大模型的结合,可以将浏览器背后场景的大量内容理解、内容生成中的AI研发所需样本量大大降低,解决标注量与成本这个在浏览器整体业务场景中的核心瓶颈。
QQ浏览器实验室自研了预训练模型“神舟”,这个模型具有百亿参数的训练能力,可以为搜索、推荐、内容理解等多种业务场景起到直接帮助,提升各种自然语言理解算法效果。神舟预训练大模型专注中文自然语言理解,基于预训练的研发模式,可以提前把语言语义中通用的知识学习到预训练模型中,针对下游具体的任务只需要学习任务相关的知识。
通过该模型QQ 浏览器可以微调和满足业务中出现的如评论理解、搜索 Query 推荐等NLP 需求,可以减少 40% 以上所需的标注数据量和相应的研发时间,节省了标注的成本,大大提升了研发的效率。在学术上,也刷新了业界纪录,登顶了中文语言理解测评基准 CLUE 榜单上,成为首个在中文自然语言理解综合评测数据上超过人类水平的预训练模型。
当前神舟大模型已经逐步应用于 QQ 浏览器的搜索、看点资讯、小说等多个场景。随着大模型进一步的迭代和实践,也会深度改造 QQ 浏览器的搜索推荐能力,更好地理解并满足用户表达背后的意图与需求。
大算力时代,机器变得更加理解信息与人,比如在医疗领域的问诊问答、交互对话等实际场景中,大模型可以为语义的理解带来更强的综合效果,而浏览器拥抱大模型,可以更好地沉淀大量的知识,帮助我们更准确地探索AI与机器学习的边界。
在全面数字化迁徙之旅中,我们获得信息的渠道和服务方式也变得越来越便捷智能,对于浏览器行业来说,让人们以优质的体验零门槛获取价值信息是核心诉求,基于这个变化与诉求,QQ 浏览器也将自己的技术品牌升级为QQ 浏览器实验室以更好地聚焦服务用户。
QQ浏览器实验室:走向下一代信息交互
对于下一代信息的交互平台,每个人心目中的浏览器都不一样,我们可能会借助元宇宙的技术,通过手势、眼神甚至是意识来操控搜索与推荐,当我们进入沉浸式的新搜索界面时,可能很多的边界都会模糊甚至消失,比如消费和应用的边界,体验与内容的边界,体验与创作的边界等,可能搜索就是一个创作的引子,发现就是探索开始的价值,用户与内容与应用开始层层递进深入,体验和交互的方式全面融合。
无论是哪种未来浏览器,本质上都是搜索网罗信息,精准推荐价值内容,这也是信息技术发展过程中的不变内核。无论未来信息交互的前景怎么变化,前提是技术的不断更迭、突破才能带来体验的重构。
(左起:腾讯副总裁郄小虎、信息平台与服务线CTO徐羽、腾讯副总裁殷宇)
QQ浏览器瞄准长线的数字化趋势价值,成立“QQ浏览器实验室”技术品牌,依靠AI、搜索、大数据、推荐算法的技术研究,提升信息与服务的获取效率,帮助用户零门槛地获取价值信息和服务,革新用户与世界的交互方式。
近些年来,我们发现腾讯越来越重视AI技术能力的构建,也成立了一些技术品牌,比如TEG(技术工程事业群)和CSIG(云与智慧产业事业群),这也是大家心目中离技术最近的品牌。以内容为主的PCG并没有得到足够的关注。随着PCG技术中台的成立,推荐AI中台也成为腾讯技术平台中的核心中台,而QQ浏览器实验室是PCG技术中台的核心支撑中台模块之一,不断为腾讯的推荐业务赋能。
实验室是创新不断诞生并生根发芽的地方,搜狗搜索团队并入后,全网搜索的技术能力与腾讯垂直搜索的能力形成互补,强强联手,这个实验室就聚合了信息交互中最核心的两个技术,可能是我们迈入未来沉浸式搜索交互的第一步。
我们知道,信息技术交互平台的发展不断进阶的目标就是消除鸿沟与隔阂,缩短人与人、人与信息的距离。腾讯信息平台与服务线CTO徐羽也公开表示QQ 浏览器的进阶目标,与之相似都是紧密连接信息与价值,拓宽用户了解世界的眼界。打造互联网未来30年的信息服务工具,做技术的摆渡人,让价值信息更好地网罗服务生活,成为探索未知的下一代超级窗口。
人类历史的长河中,随着信息技术的不断更迭,会越来越注重信息与价值的准确与高效,这也就意味着推荐系统是个无限增长且没有最优解的技术体系,不断进化是它的特点,因此理解用户的能力也会不断地深入,这样持续洞察探索推荐的新趋势和方向,会为用户带来新一代的交互体验与价值赋能。