Posted in

大众点评技术部包揽 KDD 2024 OAG-Challenge Cup 赛道全部 3 项冠军_AI阅读总结 — 包阅AI

包阅导读总结

1. 大众点评、KDD 2024、大模型、技术部、冠军

2. 大众点评技术部的 BlackPearl 队伍在 KDD 2024 OAG-Challenge Cup 赛道包揽全部 3 项冠军,采用大模型创新技术解决难题,开源代码和提交论文,后续将有技术解读,未来会深入探索大模型技术服务用户。

3.

– 大众点评技术部参赛

– 团队:搜索与内容智能团队组建的 BlackPearl 队伍

– 赛事:KDD 2024 OAG-Challenge Cup 赛道

– 赛题:WhoIsWho-IND、PST、AQA

– 夺冠及技术创新

– 采用大模型,提出自反馈增强、嫁接学习等技术

– 各赛题成果:WhoisWho 任务中提出迭代式大模型文本聚类方法;PST 任务中嫁接复杂文本语义匹配能力,构建自动特征工程链路;AQA 任务中提出 Boosting LLM For Searching 方案

– 后续动作

– 开源全部解决方案代码供交流学习

– 提交解决方案论文

– 团队成员将在 KDD 2024 展示报告成果

– 美团技术团队公众号将发布技术解读

– 未来大众点评 App 将深入探索大模型技术服务用户

思维导图:

文章地址:https://tech.meituan.com/2024/08/09/kdd-2024-oag-challenge-cup.html

文章来源:tech.meituan.com

作者:作者: 美团技术团队

发布时间:2024/8/9 0:00

语言:中文

总字数:1073字

预计阅读时间:5分钟

评分:90分

标签:数据挖掘,KDD Cup,大模型,自反馈增强,嫁接学习


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

ACM SIGKDD (Knowledge Discovery and Data Mining,简称 KDD)是数据挖掘领域的国际顶级会议。KDD Cup比赛是由SIGKDD主办的数据挖掘研究领域的国际顶级赛事,从1997年开始,每年举办一次,是目前数据挖掘领域最有影响力的赛事。

近日,来自大众点评技术部/搜索与内容智能团队组建的BlackPearl队伍,参加了KDD 2024 OAG-Challenge Cup赛道的WhoIsWho-IND、PST、AQA三道赛题,以较大优势包揽了该赛道全部赛题的冠军。

今年,KDD 2024 OAG-Challenge Cup 的三道赛题,提出的是针对学术数据挖掘领域中的论文同名消歧、论文源头追溯、学术论文检索三个经典难题。团队同学创新性地采用大模型来解决这三个问题,他们基于大模型,提出自反馈增强、嫁接学习等技术,在效果上显著优于其他队伍,在排行榜上均取得较大领先。

在WhoisWho(同名消歧任务)任务中,团队出了基于自反馈增强的迭代式大模型文本聚类方法,该方法构建的大模型文本聚类方案能够有效处理结构化信息并实现端到端直接输出聚类结果。最终以83%的gAUC指标明显超越传统机器学习方案,赢得了赛题冠军。

图1 WhoisWho  Solution by BlackPearl

在PST(论文源头追溯)任务中,团队利用嫁接学习的思想将BERT-Like模型的复杂文本语义匹配能力嫁接到LLM中,提高样本置信度。同时,团队构建了一套基于RAG的自动特征工程链路,缓解了复杂语义文本普通存在的文本多、信息杂、数据脏的问题。在最终评价指标MAP上利用7B单模型效果超出ChatGPT+RAG方案10%。

图2 PST  Solution by BlackPearl

在(AQA学术论文问答任务)任务中,带有复杂噪声的数据是该任务的主要难点。GPT4等开源大模型因为噪声问题,在场景文本搜索方面输出结果完全不可用。团队利用LLM For Vector及Boosting技术在文本搜索场景实践,提出集成召回、排序的Boosting LLM For Searching方案,在指标上全面超越基于传统文本嵌入方式的搜索方案,有效将LLM具备的语义理解能力迁移至场景文本搜索任务,解决了学术搜索场景的噪声问题。

图3 AQA  Solution by BlackPearl

BlackPearl团队开源了全部解决方案代码供研究者交流学习(https://github.com/BlackPearl-Lab/KddCup-2024-OAG-Challenge-1st-Solutions),并提交了解决方案的论文,团队成员将在巴塞罗那举行的 KDD 2024 上展示报告其研究成果。后续,美团技术团队公众号将陆续发布这三道赛题的技术解读,敬请期待。

未来,大众点评App将不断深入探索大模型技术,充分挖掘其内在潜力,通过先进AI技术产品化,使大众点评能够更精准地服务于用户,努力让AI帮大家更懂美食,更会生活。