第12章

更新时间:2026-01-14 06:04:36

试点社区名叫“荷香里”,是上世纪九十年代建成的职工家属区,红砖外墙爬满了岁月痕迹,楼道狭窄,但绿化很好,高大的香樟树下聚着下棋聊天的老人。

林浅和孙薇在居委会王主任的陪同下,花了整整两天时间,在社区里穿梭。她们访谈了十几位居民,有抱怨水管老化的退休工程师,有担心孩子放学安全的年轻妈妈,也有对加装电梯持不同意见的楼上楼下邻居。王主任提供了近三年的投诉记录本——密密麻麻的手写文字,记录着从漏水、噪声到流浪猫狗的各种琐碎烦恼。

林浅的录音笔里存满了声音:苍老的叹息、焦急的诉说、无奈的抱怨,偶尔也有对社区志愿者由衷的感谢。孙薇则着重询问居民对社区公共事务的参与意愿和看法。

晚上回到宿舍,林浅开始整理这些原始材料。将访谈录音转为文字是项枯燥且耗时的工作,她戴上耳机,一遍遍回放,确保不遗漏任何细节和语气。苏暖看她辛苦,主动帮忙转录了一部分。

与此同时,陆星宇发来的那个脚本生成的地图派上了用场。林浅在地图上标注了访谈对象的大致住址、投诉高发楼栋、社区活动室、垃圾站等关键点位,形成了一幅初步的“社区问题地理分布图”。

第三天,她将清洗后的访谈文本(脱敏后)、标注好的地图,以及从投诉记录本中摘录的典型问题文本,打包发给了陆星宇和刘博。数据量不大,文本总共不到五万字,但却是项目的第一批真实养料。

邮件发出后,林浅有些忐忑。这些数据如此“不完美”,充满了口语化表达、情绪宣泄和模糊指代,和陆星宇习惯处理的那些干净、规整的数学或代码数据截然不同。他能从中提取出有意义的信号吗?

她的忐忑在当天深夜得到了回应。

陆星宇直接打来了电话。

“数据已收到。”他的声音在深夜显得格外清晰,“预处理已完成。发现几个问题。”

林浅的心提了起来:“什么问题?”

“第一,文本中大量使用地方性指代,如‘东头那棵歪脖子树’、‘老李家阳台’。算法无法理解。需要建立社区实体别名映射表。”

“第二,情感对象模糊。例如‘物业根本不管事’,‘管’的具体对象不明确。需要根据上下文手动补充或设计指代消解规则。”

“第三,时间信息缺失。投诉记录只有日期,没有具体时间;访谈中时间描述模糊(‘前两天’、‘去年冬天’)。这影响时间序列建模。”

他一口气列出了三个核心问题,每个都切中要害。没有抱怨数据质量,只是冷静地指出障碍。

林浅边听边快速记录:“明白。实体别名表我可以和王主任一起整理。情感对象模糊和时间问题……可能需要设计更精细的文本标注规则,或者后续在模型中考虑这些不确定性?”

“两种思路。”陆星宇说,“短期,扩充标注规则,人工补充信息。长期,可以在模型中引入不确定性建模,例如将模糊指代视为潜在变量,通过上下文推断其可能指代的分布。后者更优,但算法复杂度高。”

“我们先从短期方案开始?确保试点能跑通。”林浅建议。

“可以。”陆星宇同意,“请尽快提供实体别名表。另外,基于现有数据,算法已经输出了初步的情感权重时间序列和子群体对比图。我已发到你邮箱。”

林浅精神一振:“有初步结果了?”

“嗯。趋势符合预期。针对‘电梯加装’议题,老年住户情感权重随时间呈明显上升趋势,且与几次社区协调会时间点吻合;年轻租客对此议题权重极低。针对‘垃圾分类’议题,有孩家庭权重显著高于其他群体,且在政策实施初期出现负面情绪峰值,随后缓慢回落。”

他的描述精准而冷静,但林浅却能从那简单的几句话里,“听”出一幅生动的社区情绪图谱。算法从那些杂乱的口语文本中,真的抓住了不同群体在不同事务上的“心跳”!

“太好了!”林浅忍不住提高了一点音量,“这验证了我们的基本思路是可行的!我马上看邮件!”

“图表说明在附件PDF里。”陆星宇补充,“另外,模型识别出一个异常点:在去年十一月左右,所有子群体针对‘物业管理’的情感权重同时出现一次剧烈负向波动,但投诉记录和访谈中均未明确提及具体事件。”

“去年十一月……”林浅快速回想,“我记得王主任好像提过一句,那时候社区物业公司换过一次,交接期管理有些混乱,但很快平息了。可能居民只是笼统地抱怨‘物业’,没有具体到事件。”

“这符合模型检测到的‘无明确对象的广泛负面情绪爆发’特征。”陆星宇说,“可以作为社区韧性评估中‘隐性压力点’的一个案例。”

林浅听着他平淡的叙述,心中却波澜起伏。他们不仅仅是在分析数据,更像是在用算法做“社区记忆考古”,挖掘出那些被日常话语掩盖的集体情绪痕迹。

“陆星宇,”她认真地说,“谢谢。这些结果对我们理解这个社区,意义重大。”

电话那头沉默了一下。

“是模型的结果。”他纠正道,仿佛功劳完全属于那个没有生命的算法。

林浅却笑了:“但模型是你构建的,数据是我们一起准备的。这是我们整个小组协作的结果。”

这一次,陆星宇沉默的时间更长了些。然后,他说:“嗯。实体别名表,请尽快。”

“好,我明天就去找王主任。”林浅答应,“另外,基于这些初步结果,我和孙薇、李明哲讨论了一下,想调整后续访谈的重点,更深入地挖掘几个识别出的关键议题和情绪波动点,你觉得呢?”

“可以。聚焦关键变量,提高数据信息密度,有利于模型精度提升。”他给出了技术角度的支持。

又讨论了几句后续工作安排,通话结束。

林浅挂断电话,立刻打开邮箱。附件里是几张清晰的图表:折线图展示不同议题下各子群体的情感权重随时间的变化;热力图展示不同群体对不同议题的关注度差异;还有一张时间序列异常点检测图,清晰地标出了去年十一月那个“隐性压力点”。

她看着这些图表,仿佛看到了“荷香里”社区平静表象下,那些细微而真实的情绪脉搏。

一种前所未有的成就感,混合着对技术力量的敬畏,充盈着她的胸腔。

她将图表转发给小组其他成员,并在群里简要说明了情况。很快,群里热闹起来。

刘博:【牛逼!陆神这效率!】

李明哲:【数据真的呈现出理论预测的差异了!太有意思了!】

孙薇:【看来我们访谈方向调整是对的。林浅,我们明天再去一趟?】

苏暖(被林浅拉进群帮忙的):【虽然看不懂图表,但感觉好厉害!浅浅加油!】

林浅看着屏幕上跳动的消息,目光却不由自主地落在那个始终沉默的、名字是一串默认数字的群成员头像上——那是陆星宇。刘博建群时不知从哪里找到了他的微信(或许是校内系统),强行把他拉了进来,但他从未说过一句话,头像也是灰暗的。

她点开他的头像,个人资料一片空白,朋友圈更是不可见。

真是一个……完全活在自己世界里的人啊。

但就是这个活在自己世界里的人,用他的方式,为他们的项目打开了一扇全新的窗。

林浅关掉群聊,重新看向那些图表。她打开一个新的文档,开始撰写基于这些初步发现的“社区韧性初步评估报告”草稿。

她要为这些冰冷的数字和曲线,配上来自访谈的、有温度的声音和故事。

窗外,月色如水。

而在城市的另一端,陆星宇合上了显示着模型评估指标的屏幕。他的目光落在桌上那个已经空了的黑色咖啡杯上。

杯底,残留着一点深褐色的痕迹。

他想起电话里林浅那句“这是我们整个小组协作的结果”。

协作。

这个词对他来说,通常意味着清晰的任务分解和接口定义。但这一次,似乎有些不同。那个文科女生,总能从他输出的技术结果中,迅速提炼出社会学的意义,并提出新的、有价值的探究方向。

她的思维,像一种高效的催化剂,让他构建的数学模型,不再仅仅是算法游戏,而开始与现实世界的复杂纹理产生连接。

这种感觉……不坏。

他起身,走到窗边。夜空中有薄云,星光黯淡。

他拿出手机,点开那个被迫加入的、一直被他设置为免打扰的微信群。往上翻了翻,看到了林浅转发图表后的说明,以及其他人热烈的讨论。

他的目光在林浅那段话上停留了片刻。

然后,他退出群聊,关掉手机。

房间里重新陷入寂静,只有电脑主机散热风扇发出的低微嗡鸣。

他回到书桌前,打开一个新的代码文件。

开始构思如何将“隐性压力点”的检测,也建模成一个可自动学习的算法模块。

夜,还很长。