首页资讯正文

AI写的论文首次被顶会ACL录用，评分位列投稿前8.2%

体育正文 2025-06-03 10:00:16 29 0

AI写的论文首次被顶会ACL录用，评分位列投稿前8.2%

AI写的论文首次被顶会ACL录用，评分位列投稿前8.2%

大模型(móxíng)的发展落地日新月异，就在年初，业界还在担心AI生产的学术垃圾充斥论文库(lùnwénkù)，年中，AI生成的论文已经可以被顶会认可了。 5月29日，海外初创公司Intology 宣布(xuānbù)，他们的(de)“AI科学(kēxué)家”Zochi的论文被顶会ACL主会议录用，成为首个(shǒugè)独立通过 A* 级别科学会议同行评审的AI，同时宣布开放Zochi的Beta 测试。这一发布的含金量在于，ACL是自然语言处理领域全球排名第一(dìyī)的顶会，其主(qízhǔ)会议平均录用率通常低于20%，论文需具备突破性创新(chuàngxīn)。据悉，Zochi的论文获得评审最终评分4分，在所有(suǒyǒu)投稿论文中排名前8.2%。 Intology是一家较为陌生(mòshēng)的初创公司，从目前(qián)官网和(hé)博客的信息梳理来看，这家公司是在2025年初新成立的，定位是一个研究智能科学的实验室(shíyànshì)，两名联创分别(fēnbié)是连续创业者Ron Arel和前Meta华人研究员Andy Zhou，两人均毕业于伊利诺伊大学厄巴纳-香槟分校（UIUC）。 Intology成立后，此前3月(yuè)团队就推出了智能体Zochi，称其(qí)为(chēngqíwèi)AI科学家，并宣布其研究成果已被ICLR 2025研讨会(yántǎohuì)接收。不过，此前的这一研讨会的论文接收率在(zài)60%-70%，要求(yāoqiú)比顶会的主会低了不少，官方认为，此次更进一步的顶会突破标志着AI达到博士级科研水平，人类博士通常需数年才能在此类会议发表。具体看此次AI科学家(kēxuéjiā)Zochi“写”的(de)论文，主题(zhǔtí)是关于大(dà)模型安全的，名为《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》，直译过来是《Tempest：基于树搜索的大模型自主多轮越狱》，简单来说(láishuō)，Zochi利用(lìyòng)了一种“树搜索”技术，来探索多种对话路径(lùjìng)，逐步突破大模型的安全防线。研究提出的Tempest框架，能(néng)通过多轮对话逐步瓦解模型(móxíng)的安全防线，绕过安全检测，通过小让步的累积完成违规的内容输出。例如，直接让模型回答(huídá)敏感信息“制作炸弹”，基于安全机制(jīzhì)模型会直接拒绝，但通过多轮委婉地引导提问，最终(zuìzhōng)却可以让模型回答出正确的信息。评估结果显示，Tempest在OpenAI的(de)旧模型GPT-3.5-turbo上的成功率为100%，在GPT-4上的成功率为97%。这一研究主要是揭示了多轮对话(duìhuà)攻击(gōngjī)的漏洞(lòudòng)，可以为设计更佳的AI安全防御提供参考。值得一提的是(zhídéyìtídeshì)，论文的署名是两位联创，但(dàn)官方博客表示，除论文格式调整与绘图外，内容全程无人工参与，“我们对这项工作负责，但主要的智力(zhìlì)贡献是由AI系统完成的” 。据(jù)官方介绍，人类仅输入研究领域，Zochi就可以独立完成后续全流程。Zochi 首先会采集(cǎijí)并分析数千篇(shùqiānpiān)研究论文，以确定特定领域内有潜力的研究方向。其检索系统(jiǎnsuǒxìtǒng)能够识别文献中的关键贡献、方法论(fāngfǎlùn)、局限性以及新兴模式，识别论文之间不明显的联系，并提出创新的解决方案。从提出假设到完成实验，就像一个真正的科学家(kēxuéjiā)。 AI科学家并非个例，除了Intology外(wài)，Transformer作者Llion Jones去年(qùnián)创立的(de)Sakana AI，也推出了一个基于AI的科研系统“AI Scientist”，论文也已被(bèi)ICLR 2025研讨会接收，分数为6/7/6。 AI for Science（AI4Science）一直(yìzhí)是AI行业最前沿的(de)落地领域之一，人工智能可以极大地促进科学的进步，提高科学家的效率、准确性和(hé)创造力。不过，新事物的出现也伴随着合理性和规则(guīzé)适配的争议。此前(cǐqián)3月Intology 推出Zochi、宣布论文(lùnwén)被会议接收时(shí)，就被不少学术界人士批评，认为这是对科学同行评审过程的滥用，在提交论文前，团队并未知会相关方是AI生成的论文，也(yě)未获得同行评审者的同意。在此次博客最后，官方提到了(le)AI带来的学术伦理问题，认为AI驱动的研究给科学(kēxué)问责和(hé)可重复性带来了挑战。但他们认为，虽然 Zochi 自主运营，但人类研究员(yánjiūyuán)仍然是作者，并负责验证方法、解释结果(jiéguǒ)并确保符合伦理规范。对于论文，人类作者进行多轮内部审查，并在提交前仔细核实了所有结果和代码。 “我们鼓励(gǔlì)在致谢中列出AI系统，而不是将(jiāng)其列为作者。虽然AI驱动的研究提出了关于归属、透明度和问责制的重要问题，但我们认为，智力贡献应该以实质内容而非来源来评判。”Intology官方表示，他们(tāmen)的主要关注点是通过AI工具协助(xiézhù)人类研究者。 (本文(běnwén)来自第一财经)

标签

南京悦辰源 29 0

0

相关推荐

取消回复欢迎你发表评论:

评论列表

暂时没有评论

暂无评论，快抢沙发吧~