METHOD

四步流程

Four-step workflow.
01
界定边界Define scope
和 AI 聊天,建立基础认知,确定研究范围与数据字段。
豆包 Doubao
02
数据采集Collect data
用代码自动化大规模采集信息,形成结构化数据集。
Gemini + Cursor
03
线索挖掘Find threads
把数据集交给 AI,多轮对话,找到隐藏在数据里的故事与关联。
Claude
04
产品化Ship it
把文字形态的结论变成可交互、可传播的产品。
Claude + Cursor
STEP 01

界定边界

Define scope with Doubao.
01
豆包
豆包对中国语境的理解最好,语料最丰富

和豆包聊天——确定研究范围

没有明确研究计划,随意聊。「上海纺织业是怎么发展起来的?」「近代化从什么时候开始的?」「经历过哪些大的阶段?」

发现信息量远比想象大,且非常分散——从 1861 年到现在,每一个阶段都有大量人物、事件、空间变化。于是决定:165 年全覆盖,不提前预设哪个阶段重要。

这一步的两层意义 建立基础认知——之前只知道「纺织业是上海的顶梁柱」和「老厂房改造」。
搞清楚后面数据应该提取哪些字段——时间、事件、人物、地点、机构、影响、数据来源。
STEP 02

数据采集

Collect data with Gemini & Cursor.
02
Gemini
Gemini · Google 自家模型,最了解自家 API 架构

Gemini 写需求——让 AI 给 AI 写提示词

一开始直接让 AI 按年按月搜,发现问题:国产搜索引擎排在前面的结果,官方通稿和年鉴叙述占比很高,不适合做叙事切口。也试过飞书多维表格接入 DeepSeek 联网搜索,效果差不多。最终改用 Google 搜索的 API

165 年 × 12 个月,不可能手动查,需要代码。Cursor 是集成了各种 AI 模型的代码编辑器,用自然语言告诉它想做什么,它帮写代码。但「清楚描述需求」本身有门槛——需要知道调哪个 API、数据结构、逻辑、错误处理。

所以引入 Gemini。Gemini 做的不是直接写代码,而是写一份详细的技术需求文档给 Cursor。即「让 AI 给 AI 写提示词」——把 AI 当成思考搭子,帮把模糊想法变成条理清晰、可执行的技术方案。

Gemini 网页对话:把原始诉求整理成可交给编程工具的技术说明
FIG · GEMINI 口述诉求整理后,Gemini 帮想清楚技术方案,然后交给 Cursor 写代码。 GEMINI
Cursor
Cursor · 多模型代码编辑器,写代码跑采集

Cursor 写代码——自动采集 165 年数据

Gemini 帮想清楚技术方案后,交给 Cursor 写代码。自动调用 Google API,解析、结构化、存成 CSV。

Cursor 里不同任务切换不同 AI 模型——复杂逻辑用 Claude Opus,标准化任务用自带模型。

踩过的坑:一次跑 5 年颗粒度变粗,改成一次只跑 1 年。AI 上下文窗口有限,塞太多信息精度下降。

最终拿到 CSV 表格:3,547 条数据,7 个字段

Cursor 中运行的采集任务界面截图
FIG · CURSOR Cursor Agent 交付采集脚本,含并发、重试与 Google 搜索工具调用。 CURSOR
STEP 03

线索挖掘

Find story threads with Claude.
03
Claude
Claude · 读长表、多轮追问,把散点收成叙事切口

把 CSV 交给 Claude——多轮追问找线索

小技巧:用 CSV 格式不要用 XLSX,纯文本更稳定,兼容性更好。

跟 Claude 说:「请根据这份资料分析里面有哪些线索。什么角度可以做成系列内容?什么话题可以引发强烈好奇?」

Round 1 · 散点故事

有反差有细节,但是散的

给了一批散点式故事,没有时间线,没有人物之间的关联。

Round 2 · 追问关联

「有没有串成时间线的?有没有跨越很长时间的家族/机构?有没有交叉关系?」

给出完全不同维度——跨几十年的家族线索(荣家三代近 100 年)、工厂穿越所有政治周期的档案、人物交叉网络。

Round 3 · 打开想象力

「不要被前面的对话束缚」

跳出来了——讲染料颜色如何消失、电报改变棉花交易价格体系、报纸成为最早商业信息平台、全球经济动荡的影响。

Round 4 · 空间角度

从空间维度重新读数据

挖出 400 多条跟空间相关的记录,梳理出 8 个空间主题。

核心观点 好的 prompt 不是一次性写完的,是一轮一轮「追」出来的。每一轮追问,本质是在帮 AI 调整注意力方向。
STEP 04

产品化

Ship it with Claude & Cursor.
04
Claude
Cursor
Claude 做设计方案,Cursor 写代码实现

从文字结论到可交互产品

最开始想做 PPT,但 PPT 表现力有限——静态的,不能让人自由探索数据关联。

决定做 HTML 网页。可以看时间轴、看地图空间分布、点进每条线索看具体故事。

用 Claude 做初步设计方案(页面结构、交互方式),用 Cursor 写代码实现。不需要会写代码,需要能清楚表达想要什么效果