WangShen (Shawn)

WangShen (Shawn)

推荐算法工程师Vibe Coding爱好者马拉松初级选手

Exploring the intersection of data, algorithms, and human vibes.

Your time is limited, so don't waste it living someone else's life. Don't be trapped by dogma - which is living with the results of other people's thinking.

Steve Jobs

Education

教育背景

  • 北京大学 · 前沿交叉学科研究院

    2017.09 — 2020.07
    数据科学理学硕士

    导师王亦洲研究方向语义分割、目标检测、医学图像分析

  • 北京大学 · 国家发展研究院

    2015.09 — 2018.07
    经济学本科双学位·GPA:3.09/4.0
  • 北京理工大学 · 数学与统计学院

    2013.09 — 2017.07
    统计学理学学士·GPA:90.56/100(专业排名:3/44)

Experience

工作与实习

  • 快手科技 推荐模型部2021.08 — 至今全职

    直播生成式推荐和精排模型子方向负责人

    • Mentor 指导 4 名正式员工和 3 名实习生,主导直播 OneLive 和直播 LARM 从 0 到 1 的落地全流程。
    • 业务产出优秀,获得 5 次公司优秀 LR 奖项、公司好主播建模比赛冠军,中稿多篇 KDD。
    • 熟悉直播和短视频推荐系统,模型方面做过精排、粗排、召回、多模态、生成式模型;多次参与链路改造,对于消费型和营收型业务迭代有较多经验。
    • 代表作:OneLive(业界首个直播生成式推荐工作)、LARM(首个基于 U2I 的多模态对齐框架)、FARM(频域感知的跨域融合工作)。
  • 快手科技 Y-tech 硅谷实验室2020.05 — 2021.07全职

    计算机视觉研究员(生成式模型与人脸风格化方向) · 导师王华彦

    • 负责 StyleGAN 融合与少样本人脸风格化项目,仅用 100 对非配对风格化图片,上线 WA 风格、古风等多风格客户端;统筹数据处理、服务端模型训练与推理端优化,主导 StyleGAN 融合管线整合及工具开发。
    • 参与手绘人脸风格化项目,以 StyleGAN 为数据增强手段优化混合风格训练,提升风格化效果;基于 3D 姿态设计动态人脸裁剪掩膜,解决大角度漏检问题。
    • 个人及项目成果:荣获部门优秀项目奖、最佳新人奖。
  • 旷视科技(Face++)2019.06 — 2019.10实习

    检测组计算机视觉工程师(目标检测方向) · 导师王志成

    • COCO 2019 全景分割任务世界冠军,作为队长,负责模型与损失函数设计。单模型在 mIOU 指标上较上届冠军模型高出 0.6。实现 EMANet、OCNet、APCNet 等主流注意力模块;设计 Ohem 损失与 Context 损失,显著提升分割性能。
    • 堆垛检测:自动检测箱装、袋装及各类杂货堆垛。实现单阶段检测模型 RetinaNet,并结合 Focal Loss。在 800+ 张图像上训练模型。提出一种基于图像中密度分级和动态场景的后处理策略,可有效解决视频中堆叠物品的帧间抖动问题。
  • 深睿科技(Deepwise)2018.07 — 2019.04实习

    算法部研究实习生(语义分割方向) · 导师梁孔明

    • 负责脑出血 CT 自动分割,设计 SEUnet 与多流损失函数,在 2000+ 张图像上使 Dice 系数提升 3%。
    • 主导脑梗死病灶 MRI 自动分割,融合多网络结构与复合损失函数,在 1600+ 张图像上使精度提升 1.3%。
    • 独立提出首个基于分割的脑中线检测框架,通过 CoordConv 与路径寻优,在内部及公开数据集上均取得领先性能,并在 MICCAI、ISBI 等医学影像顶会发表多篇论文

Research / Papers

论文

来源 Google Scholar

  • OneLive: Dynamically Unified Generative Framework for Live-Streaming Recommendation

    S Wang†, Y Huang†, R Yang†, S Wen†, P Xu†, J Cao, Y Liu, K Cai, C Guo, et al.† 共同一作

    arXiv preprint2026
  • QARM V2: Quantitative Alignment Multi-Modal Recommendation for Reasoning User Sequence Modeling

    T Xia, J Zhang, Y Liu, H Dou, T Yin, J Cao, X Liang, T Xie, L Liu, X Chen, et al.

    arXiv preprint2026
  • LARM: LLM-Alignment Live-Streaming Recommendation

    Y Liu†, J Cao†, S Wang†, S Wen, X Chen, X Wu, S Yang, Z Liu, K Gai, G Zhou† 共同一作

    arXiv preprint2025
  • FARM: Frequency-Aware Model for Cross-Domain Live-Streaming Recommendation

    X Li, R Yang, S Wen, S Wang, Y Liu, G Wang, W Hu, Q Luo, J Sheng, et al.

    KDD2025
  • Moment&Cross: Next-Generation Real-Time Cross-Domain CTR Prediction for Live-Streaming Recommendation at Kuaishou

    J Cao, S Wang, Y Li, S Wang, J Tang, S Wang, S Yang, Z Liu, G Zhou

    arXiv preprint2024
  • A Unified Framework for Cross-Domain Recommendation

    J Cao, S Wang, G Chen, R Huang, S Yang, Z Liu, G Zhou

    arXiv preprint2024
  • Fine-grained control of artistic styles in image generation

    X Miao, H Wang, J Fu, J Liu, S Wang, Z Liao

    arXiv preprint2021
  • Segmentation-based method combined with dynamic programming for brain midline delineation

    S Wang, K Liang, C Pan, C Ye, X Li, F Liu, Y Yu, Y Wang

    IEEE ISBI2020
  • Context-aware refinement network incorporating structural connectivity prior for brain midline delineation

    S Wang, K Liang, Y Li, Y Yu, Y Wang

    MICCAI2020
  • Joint COCO and Mapillary Workshop at ICCV 2019: Panoptic Segmentation Challenge Track Technical Report

    S Wang†, T Liu†, H Liu†, Y Ma, Z Li, Z Wang, X Zhou, G Yu, E Zhou, X Zhang, et al.† 共同一作

    ICCV Workshop2019

Projects (Vibe Coding)

AI 辅助开发项目

展示通过 AI 辅助开发的小型产品,突出创新和速度感。数据来自 content/data/projects.json。

Competitions

比赛经历

  • 快手:好主播识别建模大赛

    2025.04公司冠军1/88 支队伍5 人团队· 队长

    业务认知

    通过主播的多周期 RFM 主播行为统计特征和 AA 社交关系特征,更准确地捕捉好主播的行为模式。

    技术创新

    设计了多周期和多专家模型,解决了长周期预估、多类别预估的问题,显著提升了整体的预测精度。

    大模型应用

    利用多模态推理大模型,进行主播内容 COT 理解和世界知识推理,显著提高了好主播长尾的预测效果。

    与 CEO 合影
  • ICCV 2019 workshop:COCO全景分割比赛

    2019.10世界冠军1/13 支队伍3 人团队· 队长

    工作概述

    负责模型结构与损失函数设计。单模型在 mIOU 指标上较上届冠军模型高出 0.6。

    注意力与损失

    实现 EMANet、OCNet、APCNet 等主流注意力模块;设计 Ohem 损失与 Context 损失,显著提升分割效果。

    与 CEO 合影
  • 创新工厂:眼底水肿病变自动分割AI挑战赛

    2018.10全国第四名前 3%团队负责人(独立完成)

    多任务框架与 UNet++

    在 UNet 最高语义层加入分类头,实现多任务学习;设计并训练 UNet++ 模型,利用多尺度信息完成病变分割。在 15 张 OCT 验证集上,模型 Dice 系数达到 0.784,较基线提升 1.2%。

    指数对数损失(EL Loss)

    提出新型损失函数,改善小病灶分割效果。使用 EL Loss 后,验证集 Dice 系数达到 0.799,提升 2.7%。

    级联空洞卷积模块(CA 模块)

    设计感受野增强模块,提升大病灶分割性能。加入 CA 模块后,UNet++ 在验证集 Dice 系数达到 0.807,提升 3.5%。

    与 CEO 合影

Books

喜欢的书

  • 终身成长:重新定义成功的思维模式2026.02

    卡罗尔·德韦克 (Carol S. Dweck)

    固定型思维 vs 成长型思维:我们的一生其实都在两种思维间博弈。固定型思维认为才华是静态的,时刻担心被评价,视努力为耻辱;成长型思维认为能力可以通过努力培养,热爱挑战,视失败为进阶的阶梯。 读完《终身成长》,我最大的收获是获得了容错的勇气。它不仅仅是在教你如何成功,更是在教你如何坦然地、充满希望地面对不完美的自己。要么成功,要么成长,这个思维一直激励我不断挑战自己,尝试更新的技术,做更难的事情。

  • 遥远的救世主2017.04

    豆豆(本名李雪,代表作「灵魂三部曲」:《背叛》、《遥远的救世主》、《天幕红尘》)

    核心:打破弱势文化,重塑强者思维。为什么有些人能看透局势,而有些人只能随波逐流?这本书通过丁元英这个「鬼才」,揭示了一个残酷而深刻的概念——「文化属性」。它会告诉你:这个世界上从来没有什么救世主,真正的救赎不在于外力的拉拔,而在于你对自己认知的彻底觉醒。读完你会明白,所谓的「神话」,不过是如实观照事物规律后的产物。在大学的时候,参加芝兰社团被推荐到这本书,第一次读到惊为天人,如实观照变成了后来做事的准则。

Life / Gallery

生活与相册

  • 2025.10.10

    再见,冰岛🇮🇸

    我还会走许多弯路,还会为许多「已实现」感到失望,但一切终将实现它们的意义。

  • 2025.09.17

    30岁你好🎂

    未来的路上,时刻提醒自己,重要的不是向上或者向下,而是持续向前。愿你我都有缓慢而扎实的生活,从今天起,关心粮食、蔬菜和大自然。

  • 2024.10.27

    【首马335】首届海淀马拉松

    首届海淀马拉松,也是我的首马。赛前预期是跟着330的兔子顺下来,结果到37公里开始岔气,加上腿酸,导致跟不住,最后335安全完赛,下次再战330。 今天天气很好,一路也很平坦,起伏不大,路上加油声络绎不绝。330兔子大队伍也一直互相打气,让我真切的感受到一个人可以跑的很快,但是一群人可以跑的更远。马拉松对于我而言,是一种对身体和意志的挑战,和一群人奔跑的时候,我感受到了平日未曾感受到的生命力,它具象且热烈。