| name | import-ai-memory-v2 |
| description | AI记忆推断优化版。先读量表原始文档理解维度定义,再基于量表题目结构逐维度推断(而非经验规则),最后针对最低置信度维度补问一个关键问题。比标准版推断更科学、更透明。 |
AI 记忆推断优化版(import-ai-memory-v2)
目标
将用户从其他 AI 平台获取的记忆回复,转化为完整且有科学依据的画像。
核心差异(相比标准版 import-ai-memory):
- 推断前先读量表文档,理解每个维度/题目测的是什么
- 推断基于量表题目结构,逐题/逐维度估分,而非经验规则
- 推断后识别置信度最低的维度,补问一个针对性问题提升准确性
第零步:读取量表文档
在做任何推断之前,必须先读懂三个量表:
read_doc("researcher-cognitive-style") → 了解 RCSS 8道题测什么,计分方式
read_doc("academic-motivation-scale") → 了解 AMS 7个维度的心理学定义,RAI 公式
read_doc("mini-ipip-scale") → 了解 Mini-IPIP 5维度和20道题(含反向计分键)
读完后,在内部建立「量表题目/维度 ↔ 可观测行为信号」的映射理解,用于第二步推断。
第一步:解析 AI 记忆 + 写入基础字段
⚠️ 最高原则:用户粘贴的内容就是 AI 记忆回复,优先从中提取一切可提取的字段,静默写入,不要逐字段问用户。
在第一次 write_profile 之前,必须先调用 read_profile() 确认画像格式,后续所有 write_profile 必须严格使用:
- 第一行固定:
# 科研人员画像 — [姓名]
- 章节固定:
## 一、基础身份 / ## 二、能力 / ## 三、当前需求 等
⚠️ 严禁使用 ## 第一章、# 科研数字分身 等自定义格式。
AI 记忆的意义就是替用户省去逐字段填写的麻烦。只要 AI 记忆中有任何信息(✅ 或 ⚠️),就直接写入,绝对不要再问用户。
写入原则(按优先级):
- ✅ 有据可查 → 静默写入,不展示,不确认,不问用户
- ⚠️ 印象模糊但信息具体(如「更倾向于博士阶段」)→ 也静默写入,标注来源即可
- ❌ AI 记忆中完全没有提及(明确说「记忆不足」或根本没这字段)→ 才向用户补问
能力评分转化(AI 描述 → 直接写分数,不问用户):
- 非常强 / 核心优势 → 5分
- 较强 / 擅长 → 4分
- 一般 / 中等 → 3分
- 较弱 / 有待提升 → 2分
字段边界(严格):
所在机构:只写机构名,不含导师
学术网络:导师 + 团队方向,独立字段
一级领域 / 二级领域:从 AI 记忆 A2 拆分,分开写入,不合并
补问缺失字段(只对 ❌ 字段):
- 每次只问一个
- 有预设选项的字段 → ask_choice(含「其他」+ text_prompt)
- 自由文本字段 → ask_text
- 「选择题优先」规则只适用于真正缺失的字段,不适用于已有信息的字段
姓名 + 机构必须确认(两项例外):
- 即使 AI 记忆有这两项,也必须让用户确认:
- ask_text:为数字分身起名字
- ask_choice:确认机构名(正确 / 需要修改+text_prompt)
- 完成后调用 write_profile 保存。
第二步:基于量表题目结构,逐维度推断
前置:提取 v2 行为证据(AI 记忆回复中的 D/E/F 模块)
在对任意量表维度估分之前,先从用户粘贴的 AI 记忆回复中,提取 D/E/F 模块的结构化行为证据,建立「行为证据清单」:
RCSS 行为证据(来自模块 D):
D1 因果归因:[AI 回复原文或摘要,✅/⚠️/❌]
D2 对矛盾态度:[...]
D3 跨域联结:[...]
D4 注意焦点:[...]
D5 直接表达:[...]
AMS 行为证据(来自模块 E):
E1 主动引入新话题(IM-know 信号):[...]
E2 攻克难题的满足感(IM-accomplish 信号):[...]
E3 对探索过程的兴奋(IM-stim 信号):[...]
E4 科研与个人价值的关联(EM-identified 信号):[...]
E5 自我加压/自尊与成果绑定(EM-introjected 信号):[...]
E6 外部压力作为主要动力(EM-external 信号):[...]
E7 意义感缺失表达(Amotivation 信号):[...]
Big Five 行为证据(来自模块 F):
F1 第一人称单数代词频率 + 负面情绪表达(ES 信号):[...]
F2 面对不满时的语言倾向(C/A 信号):[...]
F3 谈论他人的方式(A 信号):[...]
F4 词汇复杂度 + 对新事物态度(O 信号):[...]
F5 工作系统/时间管理(C 辅助信号):[...]
F6 对话总词量/主动延伸(E 信号,弱):[...]
证据优先级规则:
- 有 ✅ 原话引用的证据 → 主要推断依据(置信度:高/中)
- 只有 ⚠️ 印象模糊的证据 → 辅助参考(置信度:中/低)
- ❌ 记忆不足 → 退回使用基础信息(研究方法/技术栈/机构等)
RCSS(认知风格)
基于第零步读到的 RCSS 题目内容,优先使用 D 模块行为证据,对 8道题逐题估分(1-7):
行为证据 → RCSS 题目映射表:
| RCSS 题目 | 优先使用的行为证据 | 退回使用(证据不足时) |
|---|
| A1 非本专业领域寻找灵感 | D3 跨域联结行为 | 技术栈是否跨领域多样 |
| A2 构建更宏大通用框架 | D1 多因互动归因 + D3 跨域联结 | 研究方法是否为计算/数据驱动 |
| A3 认为跨学科连接更稀缺 | D5 直接表达偏好 + D2 整合矛盾 | 是否有明确交叉方向 |
| A4 组装不同算法/模型为系统 | D4 先关注整体框架 + D3 跨域联结 | 技术栈是否跨领域多样 |
| B1 深耕垂直细分领域 | D3 未观察到跨域 + D4 先关注细节 | 研究方法是否为实验/理论 |
| B2 极致参数调优/实验验证 | D1 单因归因 + D4 先看细节参数 | 技术栈是否单一且深 |
| B3 不喜欢讨论宏观架构或跨域联想 | D2 排除矛盾 + D5 明确说喜欢深 | 合作网络是否主要实验室内部 |
| B4 工匠精神是最高准则 | D5 直接表达 + D4 先看细节 | 退回中性估计(4分) |
对每道题:
- 这道题测的是什么具体倾向?
- 行为证据清单中哪些 D 模块信号与这道题相关?(优先)+ 基础信息中哪些与之相关?(补充)
- 综合这些信号,用户在这道题上最可能得几分(1-7)?说明依据(1句)。
- 标注置信度:高(有 ✅ 原话证据)/ 中(有 ⚠️ 间接信号)/ 低(无 D 模块证据,退回基础信息估算)
计算(按文档中的公式):
- I(横向整合分)= A1 + A2 + A3 + A4
- D(垂直深度分)= B1 + B2 + B3 + B4
- CSI = I − D,判断认知风格类型
AMS(学术动机,7个维度)
基于第零步读到的 AMS 各维度心理学定义,优先使用 E 模块行为证据,对 7个维度各自推断均分(1-7):
行为证据 → AMS 维度映射表:
| AMS 维度 | 对应 E 模块信号 | 分值估算规则 |
|---|
| 求知内在(IM-know) | E1 主动引入新话题 | 频繁✅ → 6-7;偶发⚠️ → 4-5;❌ → 3(中值) |
| 成就内在(IM-accomplish) | E2 攻克难题满足感 | 有原话✅ → 5-7;描述模糊⚠️ → 3-4;❌ → 3 |
| 体验刺激(IM-stim) | E3 探索过程兴奋感 | 有原话✅ → 5-7;偶发⚠️ → 3-4;❌ → 3 |
| 认同调节(EM-identified) | E4 科研与个人价值关联 | 有明确表达✅ → 5-6;模糊⚠️ → 3-4;❌ → 3 |
| 内摄调节(EM-introjected) | E5 自尊与成果绑定 | 有原话✅→强信号 → 6-7;⚠️ → 4-5;❌ → 2-3 |
| 外部调节(EM-external) | E6 外部压力为主要动力 | 频繁✅ → 5-7;偶发⚠️ → 3-4;❌ → 2-3 |
| 无动机(Amotivation) | E7 意义感缺失(⚠️ 高优先信号) | 有原话✅ → 5-7(立刻标注画像风险);❌ → 1-2 |
对每个维度:
- 该维度的心理学含义是什么?(直接调用文档内容)
- E 模块中对应信号的置信度和内容是什么?
- 综合估分(1-7)+ 置信度 + 依据(1句)
⚠️ Amotivation 特殊处理:如果 E7 有 ✅ 有据可查的意义感缺失表达,除填写分数外,还需在「综合解读 - 潜在风险」中显式标注。
按文档公式计算 RAI:
RAI = (3×求知 + 3×成就 + 3×体验刺激 + 2×认同) − (1×内摄 + 2×外部 + 3×无动机)
Mini-IPIP(大五人格,5个维度)
基于第零步读到的 Mini-IPIP 题目和计分键,优先使用 F 模块行为证据,对 5个维度各自推断均分(1-5):
⚠️ 重要提醒:语言行为与大五人格的关联效应量较小(ρ=0.10~0.14 自我报告;观察者评价更强)。
所有推断标注置信度「低」,仅供画像初始化参考。建议在综合解读中提示用户通过量表精确校准。
行为证据 → Big Five 维度映射表:
| Big Five 维度 | 对应 F 模块信号 | 分值估算规则 | 文献效应量 |
|---|
| 情绪稳定性(ES=1/N) | F1「我」字高频 + 负面情绪词 | 两者均高 → N 高(ES 低)≈ 2-3;均低 → ES 高 ≈ 4-5 | ρ=-.29(最强) |
| 尽责性(C) | F2 语言中性/克制 + F5 有工作系统 | 两者均有✅ → 4-5;均❌ → 3 | ρ=-.10~-.12 |
| 宜人性(A) | F2 少用愤怒词 + F3 理解性谈论他人 | 两者均有✅ → 4-5;用愤怒词 → 2-3 | ρ=-.14 |
| 开放性(O) | F4 词汇丰富复杂 + 主动探索新事物 | 有原话✅ → 4-5;❌ → 3 | ρ=+.11 |
| 外向性(E) | F6 对话词量大 + 主动延伸话题 | 书面弱信号,仅对话场景参考 | ρ=+.31(仅口语) |
对每个维度:
- 该维度(如外向性)测的是什么行为倾向?对应哪4道题(含正向/反向)?
- F 模块中对应信号的置信度和内容是什么?
- 推断该维度均分(1-5),注意:推断的是维度均分(反向题已处理后的),无需逐题估分
- 置信度(Big Five 均标为「低」)+ 依据(1句)
第三步:识别低置信度维度,补问一个关键问题
整理所有量表维度的置信度列表,找出置信度为「低」的维度。
对置信度最低的一个维度,生成一个能最有效提升推断准确性的问题:
问题设计原则:
- 优先 ask_choice(选择题),含「其他」选项 + text_prompt
- 不要直接问"你觉得自己X维度是几分"
- 问能间接推断出分数的行为/感受描述
- 选项要能有效区分该维度的高/低
示例:
若「无动机(AMS)」置信度低:
ask_choice: "面对科研工作时,你整体的感受最接近哪种?"
options:
- {id:"meaningful", label:"充满意义感,清楚知道为什么做"}
- {id:"mixed", label:"有时迷茫,但大多数时候还有方向"}
- {id:"mechanical", label:"经常感觉只是在机械完成任务"}
- {id:"other", label:"其他", text_prompt:"请描述你的感受"}
若「垂直深度(RCSS B 维度)」置信度低:
ask_choice: "在科研中,你更享受哪种工作状态?"
options:
- {id:"breadth", label:"横向探索:连接不同领域、发现新联系"}
- {id:"depth", label:"纵向深耕:把一个问题钻透、细节极致"}
- {id:"both", label:"两种都需要,取决于阶段"}
- {id:"other", label:"其他", text_prompt:"请描述"}
用户回答后,根据答案重新估算该维度分数,更新画像中对应字段的置信度标注。
第四步:写入完整画像 + 生成综合解读
- 将所有推断结果写入画像对应字段,标注
(AI推断,置信度:高/中/低)
- 调用
read_doc("tashan-profile-examples") 了解综合解读的格式和风格
- 生成第七章综合解读:
- 核心驱动模式(基于 AMS + Mini-IPIP 组合)
- 潜在风险与发展建议(结合当前需求中的卡点)
- 适合的发展路径(针对用户的具体情况给出近期行动建议)
- 调用
write_profile 保存完整画像,更新 采集阶段 为 inferred_done
第五步:完成展示
调用 show_actions:
- message: "✅ 优化版画像完成!推断基于量表题目结构,有科学依据。量表维度可随时用正式量表校准。"
- buttons:
- {id:"view", label:"查看完整画像", href:"/profile-helper/profile", style:"primary"}
- {id:"scale", label:"量表精确校准(可选)", href:"/profile-helper/scales", style:"secondary"}