令人满意地得到保证

A widely recognized collection for machine learning tasks.
Post Reply
Bappy11
Posts: 353
Joined: Sun Dec 22, 2024 6:02 am

令人满意地得到保证

Post by Bappy11 »

]然而,语言模型的编辑潜力尚未得到充分利用——因为有时很难跟上模型的发展或其用户界面或功能范围的变化。此外,由于系统的工作方式,重现结果时会出现一些根本问题。目前,编辑团队主要使用 OpenAI 网站的图形界面与 GPT-4 或 4o 进行交互。在 2024 年 5 月的一次研讨会上,格拉茨大学信息建模中心的历史学家 Christopher Pollin 向编辑团队介绍了生成语言模型在编辑工作中的可能用途。此外,双方还共同尝试实现实体的部分自动化标记。这些可以改善目前 5,000 个编辑协议的内容索引的定量和定性范围。理想情况下,人们可以使用常见的商业 AI 模型来 至少支持有时重复且无趣的命名实体识别(NER)工作,例如针对地理特征或人物。然而,很快就发现,尽管具有明显的潜力,但通过当前可用的大型语言模型 (LLM) 聊天机器人实现所需的连续和可重复的处理仍不能
发现了三个主要问题:首先,模型的上下文窗口无法应对各自编辑协议的文本量。其次,研究数据缺乏可重复性,语言模型的幻觉是一种反复出现的现象——尽管考虑到这些模型的一般随机操作原理,目前仍不清楚是否有可能获得 马耳他电报数据 完全可重复的结果。第三,首先清理 XML 数据,然后将结果转换回 TEI-XML 格式的过程需要太多额外努力。

在对个人协议和编辑程序的个人索引进行初步实验时,使用了当时流行的 GPT-4o 模型来识别命名实体,例如个人(姓氏)或地名,以结构化的方式准备它们并将它们与我们个人列表的标识符链接起来或从根本上促进这种链接。仅部分成功的实验向我们表明,使用提供的用户界面尚无法以一致的质量实现研究数据的可重复性。我们还观察到了前面提到的产生幻觉的倾向,而不是例如发出错误消息或清楚地传达未找到匹配项的倾向。因此,编辑团队仍需要进行详细的后续检查,因此迟早会出现努力和回报的问题。例如,目前看来,使用定制的 Oxygen 编辑器机制(脚本、正则表达式等)编辑文档似乎比改进 AI 模型的输出更经济。
Post Reply