简介
理悦CEMA•恒升系列讲座第一讲将于5月15日(周五)中午11:30-13:00在学术会堂712会议室举行,由中国科学院数学与系统科学研究院奚晋老师报告“LLM Survey Framework: Coverage, Reasoning, Dynamics, Identification”(LLM调查框架:覆盖范围、推理机制、动态特性及识别方法)欢迎广大师生(尤其科研有兴趣和追求的本科生、硕士生和博士生)参加。讲座对所有人开放,不需要提前预约。
题目
LLM Survey Framework: Coverage, Reasoning, Dynamics, Identification
(LLM调查框架:覆盖范围、推理机制、动态特性及识别方法)
报告人
奚晋
奚晋,中国科学院数学与系统科学研究院预测科学研究中心助理研究员,2024 年毕业于加州大学圣地亚哥分校,获经济学博士学位。主要研究领域包括人工智能与经济学交叉应用、宏观预测计量方法、非平稳时间序列及因果推断。主持国家自然科学基金青年项目(C类)。
摘要
We propose a new LLM-based survey framework that enables retrospective coverage, economic reasoning, dynamic effects, and clean identification. We recover human-comparable treatment effects in a multi-wave randomized controlled trial of inflation expectations surveys, reducing total survey costs from up to $1,000,000 to roughly $40. To demonstrate the framework’s full potential, we extend the benchmark human survey (10 waves, 2018–2023) to over 50 waves dating back to 1990. We further examine the economic mechanisms underlying agents’ expectation formation, identifying the mean-reversion and individual-attention channels. Finally, we trace dynamic treatment effects and demonstrate clean identification. Together, these innovations demonstrate that LLM surveys enable research designs unattainable with human surveys.
我们提出了一种基于大型语言模型(LLM)的新型调查框架,该框架能够实现回顾性数据覆盖、经济逻辑推理、动态效应分析以及清晰的变量识别。在一项关于通胀预期的多轮随机对照试验中,我们成功复现了与人工调查相当的处理效应,将总调查成本从最高100万美元降至约40美元。为充分展示该框架的潜力,我们将基准人工调查(10轮,2018–2023年)扩展至涵盖1990年以来超过50轮的数据。我们进一步剖析了代理人预期形成背后的经济机制,明确了均值回归效应与个体注意力效应的作用路径。最后,我们追踪了动态处理效应并验证了变量识别的准确性。这些创新成果共同证明,基于LLM的调查方法能够实现传统人工调查无法实现的研究设计。
时间
5月15日11:30-13:00
地点
学术会堂712
活动对象
创新发展学院师生
主办单位
创新发展学院
中国经济与管理研究院
撰稿:奚晋
审稿:何其春
编辑:沈嘉怡
审核:赵扶扬