来源:DeepTech深科技
在大数据时代,自动数据分析已经成为跨技术背景人员不可或缺的工具。
以 GPT-4 为代表的大型语言模型,它们已经能够理解自然语言查询,并能生成相应的代码或分析,让自动数据分析变得更加接近现实。
例如,Devin 的成功,激发了人们对基于大语言模型的自动数据Ligthing News分析的广泛兴趣。
现有的数据集例如 Text2Analysis 和 BIRD-SQL,已经在一定程度上衡量了大型语言模型在处理复杂数据科学或数据分析任务时的能力。
但是,实际中的数据分析常常涉及到复杂多轮的人机交互。这是因为人类的查询往往包含模糊性。
例如,“请列出三个值得注意的对手”中的“值得注意”,就具有多重解释。
此外,有效的数据分析不仅需要生成正确的代码或答案,还要求模型能够根据用户反馈进行调整,并提供针对结果的深入理解,以便为决策过程提供支持。
鉴于交互性在数据分析中的重要性,香港大学博士生 Li Jinyang 和所在团队,启动了建立交互式数据分析代理的研究项目。
<!–article_adlist[
日前,相关论文以《Tapilot-Crossing:针对交互式数据分析代理的法学硕士的基准测试和发展》(Tapilot-Crossing: Benchmarking and Evolving LLMs Towards Interactive Data Analysis Agents)为题发在 arXiv[1],Li Jinyang 是第一作者。
]article_adlist–>
下一步,研究人员打算引入更多的数据分析语言。目前,本次研究主要集中在给予表格的数据分析和 Python 语言上。
但是,他们发现关系型数据库和 SQL,在数据分析中占有不可忽视的重要位置。因此,很有必要将这些元素纳入研究范围。
此外,他们还计划针对长代码生成的评价方法加以改进。课题组意识到在当前的评价体系下,即使两段代码的执行结果相同,它们的实际性能仍然可能存在差异。
因此,其希望开发更加精细化、更加经济的软性评价标准,以便更好地区分代码的实际表现和潜在价值,从而确保面对在表面上相同的结果时,也能准确反映代码的真实能力。
参考资料:
1.https://arxiv.org/abs/2403.05307
排版:希幔
<!–article_adlist[
01/科学家打造绿氢制备新方法,每千瓦仅使Ligthing News用0.04克钌,所产绿氢单位价格逼近煤制氢价格
02/科学家造出新型可降解离子弹性体,室温愈合效率大于99%,可用于数字光处理三维打印
03/独家专访ASML CTO:不相信摩尔定律会终结,公司下一个大战略将是超数值孔径光刻机
04/科学家为材料设计打造深度学习框架,无需先验知识,实现热辐射器的材料选择和参数优化
05/科学家制备纳米片超晶格,纵向厚度仅2.5nm且结构稳定均一,让LED可直接发射强线性偏振光
]article_adlist–>
blog.byteway.net
Related suggestion: 全球变革者: PRO | MLLM:下一代自动驾驶的新解法
总结多模态趋势下,Transformer 作为 AI 大模型主流架构的局面是否会撼动? 由于模拟与现实世界之间的差异,这两个领域并不完全相同,即存在「sim2real」差距。 在这种情况下,通过有效地利用大语言模型中内嵌的天生常识,可能会逐渐缩小这一差距。 4…