Research

【Research】现实世界状态缺失的基础设施

现实世界“状态”缺失的基础设施

文章分类:Research

摘要:本文提出“状态基础设施缺口(SIG)”概念,指出白领工作本质是状态同步。传统数据库仅存储数据而非状态,导致高昂的重构成本。大语言模型(LLM)首次使非结构化状态处理成为可能,但配套基础设施尚未建立。本文跨学科探讨该缺口的成因与影响。

TL;DR

现代知识工作充满摩擦:繁琐的行政文档要求、无休止的状态会议、高昂的验证流程。我们一直归咎于糟糕的工具和沟通不畅。

真正的原因更深层:我们缺乏一种用于表征现实事物“状态”的基础设施层。

我们将其称为状态基础设施缺口(SIG)

本文提出一个跨学科框架,融合信息经济学、AI知识表示与数字孪生工程,解释该缺口为何存在、为何延续数十年,以及为何大语言模型(LLM)是首个使其得以弥补的技术。

核心洞察(60秒速览)

核心论点可分六步阐述:

  1. 全球白领工作最终收敛于三项活动:撰写文档、整理数据、协调沟通。
  2. 这三项活动服务于一个根本目的:让另一方知晓某个实体的当前状态
  3. 重度依赖增删改查(CRUD)的岗位(如会计、HR、供应链、客服)本质上是“人类状态同步器”——连接现实与数字系统的生物中间件。
  4. 繁琐的验证流程(签证申请、贷款审批、尽职调查)之所以存在,是因为缺乏可信的直接查询渠道。我们只能重建状态。
  5. 该问题同时存在于结构化状态(可存入数据库)与非结构化状态(存在于人脑与对话中)。
  6. 大语言模型(LLM)首次使机器处理非结构化状态成为可能,但利用这一能力的基础设施尚未建立

关键概念:状态 ≠ 数据

数据是记录的值。它静态、离散、无上下文。数据库字段中显示 status: approved 的只是数据。

状态是现实实体在特定时间点的实际条件。它具备数据所缺乏的四个属性:

属性 含义 重要性
时间性 (Temporality) 状态受时间约束且持续变化 现实变化与数字映射之间的滞后,正是摩擦的根源
主观性 (Subjectivity) “完成度80%”取决于评判者 状态难以被简化为二元字段
置信度 (Confidence) 并非所有状态记录都同样可信 一手更新 ≠ 二手传闻,但数据库通常一视同仁
关系上下文 (Relational context) 状态与其他状态相互交织 理解一个状态,需遍历相关状态网络

传统数据库实际存储的是状态的压缩痕迹——在压制不确定性、歧义和来源冲突后,留下的最后一个被接受的快照。这不是缺陷,而是一种本体论承诺。结构化系统用语义丰富性换取了一致性与可查询性。这种权衡通常很有用。但当底层状态无法在不损失核心语义的情况下被简化时,代价就显现了。

后果是:组织常将“数据的存在”等同于“状态的存在”。CRM 记录可能显示交易阶段,却未体现背后的置信度、支撑证据或潜在依赖。工单可能显示“进行中”,但真实状态——因法务受阻、经理降低优先级或实际被放弃——却存在于别处。

人类状态同步器

本文提出新概念。人类状态同步器指主要职能作为现实与数字系统之间翻译层的从业者。他们检测现实中的状态变化,并手动录入无法自主检测这些变化的系统。

该概念在分析上区别于野中郁次郎的“知识工作者”(价值在于知识创造)和图什曼的“边界跨越者”(在组织边界间做中介)。人类状态同步器定义更窄:将观察到的、推断的或本地持有的条件,转化为他人或系统可执行记录的人。

其范围远超后台岗位,延伸至销售运营、项目协调、合规、招聘、客户成功与管理汇报。这些岗位的存在并非因为劳动本身具有内在价值,而是因为自动化状态采集的基础设施缺失。组织误将大量衍生劳动识别为内在工作。许多情况下,招人是为了弥补基础设施的不足。

状态重建成本

当无法直接查询实体状态时,你必须支付重建状态的间接成本:

每一份签证申请、每次贷款审查、每场审计、每次状态会议,都是状态重建活动。在这些场景中,文件仅作为证据链而非目的本身:银行流水代表财务状态,在职证明代表职业连续性,燃尽图代表项目进度。

三大领域,一个盲区

SIG 框架统一了三个独立探讨该问题碎片、却从未互通的理论体系:

1. 信息经济学 (Information Economics)

Akerlof (1970)、Spence (1973)、Stiglitz & Weiss (1981) 解释了为何状态验证成本高昂。签证材料是阿克洛夫信号。大学学位是斯彭斯信号。贷款申请是斯蒂格利茨分析的验证机制。信号之所以可信,并非因其内在信息量大,而是其成本结构使得模仿困难。

缺失视角:它将信息成本视为外生变量,未探讨当技术大幅降低状态验证成本时会发生什么。

2. 知识表示 (Knowledge Representation, AI)

Davis 等人 (1993)、Minsky (1975)、Hayes (1979)、Nonaka (1994)、Orlikowski (2002) 指出,每种知识表示都是一组本体论承诺,决定了什么可被表达。关系数据库用语义丰富性换取可查询性。Orlikowski 更进一步:组织中的认知是实践的持续成果,而非可捕获的静态库存——这解释了为何大量相关状态保持非正式。

缺失视角:知识表示研究聚焦推理系统,而非组织状态同步基础设施。

3. 数字孪生 (Digital Twins, Engineering)

Grieves & Vickers (2017)、Tao 等人 (2019)、Listl 等人 (2024) 提出了最接近的现有范式,维持物理实体与数字表示之间的双向实时同步。它们展示了当状态同步被内置于底层时会发生什么。

缺失视角:数字孪生依赖传感器。知识工作的状态本质上是判断性的,只能通过自然语言捕获。问题不仅在于遥测数据缺失,更在于缺乏语义丰富、置信度感知的遥测数据。

当状态描述以自然语言表达——富含上下文、细微差别与主观判断——如何大规模捕获、存储、同步与查询?

此前无领域能回答此问题,因为技术前提不存在——直到大语言模型(LLM)出现。

状态基础设施缺口(SIG):四个维度

  • 语义:存储系统无法保留现实状态的语义丰富性。“项目大体正常,但认证模块存在未解决的设计分歧”被压缩为 status: yellow
  • 置信度:所有记录被视为同等权威。工程师30分钟前更新的 Jira 工单 ≡ 上周PM通过旧邮件更新的工单。
  • 同步:更新由人工触发。会议、Slack、代码审查中的状态变化不会自动同步至追踪系统。
  • 聚合:状态分散在数十个孤立工具中。客户的“真实”状态需综合 CRM + 邮件 + 客服 + 账单——且始终依赖人工合成。

真实成本:四项经济后果

状态重建成本不只是一个公式。它以四种不同方式在组织内蔓延:

衍生劳动力需求 (Derived Labor Demand)

当状态无法直接查询时,组织雇佣人员去收集、翻译、对账和转移

文章来源: https://dify.ai/blog/the-missing-infrastructure-for-real-world-state
← 返回文章列表