基本信息
姓名:胡紫霞
电话:17600431688
英语:GRE, CET-6
教育:中国农业大学 985硕士
邮箱:ZixiaHu@cau.edu.cn
Code:MetaGPT 代码贡献者
工信部:人工智能—大模型与AIGC 高级证书
工信部:大数据分析师 高级证书
Agent:AI Agent Developer 证书
Microsoft:AI Applied Skills 证书
AI创客松:Multi-Agent for X 最佳人气奖 (阿里云 & 魔搭社区 & Datawhale)
开源社区:动手学 AI 视频生成 最佳视频奖 (Datawhale & 奇想星球)
企业荣誉:多次 荣获企业年度 A级 绩效奖、24薪等
学校荣誉:多次 荣获国家奖学金、国家励志奖学金等
教育信息
中国农业大学 — 农学硕士 — 预防兽医学
2014 — 2016
安徽农业大学 — 农学学士 — 动物医学
2010 — 2014
安徽农业大学 — 管理学学士 — 财务管理
2010 — 2014
论文信息
工作经历
资深算法工程师 — 百融云创科技股份有限公司
2024 — 至今
在百融云创信贷云业务线,负责榕树与场景金融等核心渠道的机构智能路由,从0到1的系统设计与优化,涵盖撞库、进件、提现等全流程环节,通过精准匹配用户与机构,显著提升放款效率与收益转化:进件路由模块优化,人均放款提升3%-30%+;支持榕树业务放款增量超2亿元,场景金融业务增量超1000万元;主导智能营销系统方案设计,探索将大模型能力应用于短信文案生成与用户精准触达场景,构建画像驱动的内容生成与分发逻辑。
-
S (Situation)
- 百融云创信贷云业务线(榕树、场景金融等核心渠道)面临用户与机构匹配精准度不足、全流程转化效率低的问题:进件渠道分发无智能化策略,提现环节产品推荐适配性差,撞库环节效率低制约后续转化,传统营销内容同质化导致用户触达效果弱,核心指标(人均放款、毛利、放款增量)增长乏力。
-
T (Task)
- 主导核心渠道机构智能路由系统从 0 到 1 的设计与全流程优化,覆盖撞库、进件、提现等关键环节,通过精准匹配用户与机构提升放款效率;同步探索大模型在智能营销场景的落地,构建个性化内容生成与分发体系,支撑业务规模化增长与收益转化。
-
A (Action)
-
项目一:进件路由
-
渠道智能分发: 主导 20 余个进件渠道的算法模型接入与分发策略迭代,设计智能路由机制动态调整渠道流量分配逻辑,适配不同渠道特性。
-
推荐系统搭建: 全流程攻克样本构建、特征深度挖掘(开发 PID 维度核心特征)、多目标建模(MTL)等技术难点,从 0 到 1 搭建推荐系统,形成 “数据 - 模型 - 策略” 闭环。
-
流量精细运营: 基于渠道特性差异化调优策略,在 10%-50% 流量区间内精准分配资源;累计完成 10 + 个多目标进件模型全链路优化(上线 100 余次),开发新老客实验指标与分析代码支撑迭代。
-
项目二:提现路由
-
全链路闭环构建: 主导推荐系统 “训练 - 发布 - 自动上线 - 校验” 全链路搭建,实现天级实验效果分析,提升策略迭代效率。
-
个性化推荐设计: 针对可提现产品数量限制,设计适配新老客及全机构场景的个性化推荐模型 8 个,通过 3 轮样本迭代优化预测效果。
-
特征体系的支撑: 开发 1000 + 特征(含集团 DTS 特征 400+、风控特征 100+、实时特征 30+),构建全面的特征支撑体系强化模型表达。
-
项目三:整体撞库
-
算法方案的设计: 设计基于推荐算法的撞库策略,优化撞库效率与精准度,为进件转化奠定技术基础。
-
跨部门协同落地: 联动产品、运营、研发明确落地细节,协调资源对齐目标,推动方案从设计到执行的顺畅落地。
-
模型与数据优化: 推进样本特征开发与模型耗时优化,通过特征存储方式升级提升数据获取效率与稳定性。
-
项目四:智能营销
-
个性化的方案: 设计大模型微调 + 智能推荐融合的个性化短信方案,构建 “内容生成 - 推送 - 效果反馈” 闭环链路。
-
用户画像应用: 结合用户画像开发营销文案生成机制,输出个性化内容,支撑精细化运营策略落地。
-
R (Result)
-
进件路由: 人均放款提升 3%-30%,其中多目标模型驱动人均放款超 20%、人均毛利超 40%;支撑榕树业务放款增量超 2 亿元,场景金融业务增量超 1000 万元。
-
提现路由: 人均放款金额提升 3%-5%,累计带来放款增量超 600 万元;推荐系统迭代效率提升,实现天级模型更新和效果分析。
-
整体撞库: 撞库效率与精准度显著提升,为后续进件转化提供技术支撑,业务全链路智能化水平升级。
-
智能营销: 验证大模型在营销场景的应用价值,个性化内容提升用户触达精准度,为精细化运营提供新路径。
高级算法工程师 — 北京海纳金川科技有限公司
2023 — 2024
在科技平台工作期间,负责将大模型应用到实际项目中,包括大模型微调、智能客服、视频生成以及自然专家系统等。这些项目旨在提升智能化水平、内容生成能力和用户体验等。
-
S (Situation)
- 科技平台面临智能化服务能力不足、内容生产效率低的核心痛点:传统客服依赖人工响应,问题解决率低且响应滞后;视频内容制作依赖专业团队,周期长、成本高;通用大模型在业务场景适配性不足,推理效率与任务精准度待提升,制约平台用户体验与运营效率。
-
T (Task)
- 主导三大核心技术落地项目:构建基于大语言模型的智能客服系统,提升服务精准度与效率;开发多模态视频生成体系,实现内容自动化生产;针对业务场景优化大模型微调技术,提升模型任务适配性与系统性能,支撑平台智能化升级。
-
A (Action)
-
项目一:智能客服系统
-
架构设计: 搭建 “RAG + 大语言模型” 双驱动架构,整合 LangChain 框架、Text Embedding 向量模型与 Chromadb 知识库,构建 “用户提问 - 向量检索 - 知识增强 - 精准回复” 全链路闭环。
-
知识库建设: 梳理产品手册、FAQ、服务流程等核心知识,结构化存储并建立周级更新机制,覆盖多数高频咨询场景。
- 检索优化:引入 CrossEncoder 排序模型提升知识库匹配精度,针对 PDF 表格等特殊内容,通过 OCR 技术与多模态解析实现结构化问答。
-
监控体系: 建立指标体系(响应时长、准确率、用户满意度),基于反馈数据优化模型参数与知识库内容。
-
项目二:视频生成体系
-
系统开发: 设计多模块协同架构,集成 Stable Diffusion/DALL-E(图像生成)、TTS 语音合成、Moviepy 视频剪辑工具,覆盖 “文本解析 - 分镜设计 - 素材生成 - 合成输出” 全流程。
-
Agent 协作: 开发多 Agent 任务调度机制,实现文字解析、分镜规划、素材生成、合成优化等 Agent 的自动化协同,减少模块衔接延迟。
-
功能落地: 支持三大核心场景 —— 文本生成剧情视频(自动分镜 + 角色一致性强化)、图文混合生成解说视频(图片语义匹配 + 语音同步)、视频二次创作(风格迁移 + 内容增补)。
-
效果优化: 通过 Prompt 记忆机制强化角色/场景连贯性,基于用户反馈迭代生成参数,提升视频清晰度与内容逻辑性。
-
项目三:大模型微调
-
技术选型: 针对客服问答、视频脚本生成等场景,采用 LoRA/QLora 轻量化微调技术,在 ChatGLM、LLaMA 模型基础上优化特定任务表现,减少微调参数量。
-
性能优化: 通过模型量化、推理加速等技术,降低显存占用,提升推理速度;结合分布式训练策略,缩短迭代周期。
-
效果验证: 构建任务专属评估数据集,从准确率、文本匹配度、用户反馈等维度验证微调效果,确保模型适配业务场景需求。
-
R (Result)
-
智能客服系统: 提高客户满意度和问题解决率,降低客服响应时间,提升平台的整体效率。
-
视频生成体系: 实现视频自动化生成功能,内容制作周期缩短,生产效率提升,用户创作参与度有一定增长。
-
大模型微调: 优化后的模型在特定业务场景表现更优,推理效率提升,资源消耗降低,支撑各系统稳定运行。
高级算法工程师 — 北京华品博睿网络技术有限公司
2018 — 2023
在招聘平台任职期间,负责店长直聘、BOSS直聘、蓝领交付三大核心业务线的推荐系统建设与优化工作,涵盖召回、粗排、精排、重排等完整链路,推动用户招聘求职体验与商业指标的持续增长。通过设计模型架构、构建样本体系、开发特征工程、挖掘数据价值,最终落地精细化增长策略,实现核心业务指标的规模化提升。
- 在店长直聘业务中,B端DAU从10万提升至40万,C端DAU从20万提升至80万,B/C两端转化率分别提升超100%和150%;
- 在BOSS直聘蓝领业务中,B端DAU从80万增长至100万,C端DAU从150万提升至200万,B/C两端转化率提升分别超过30%和50%;
- 在蓝领交付场景中,日均20万条线索分配通过模型与策略优化,显著提升入职转化率,增幅达100%以上。
通过系统性算法迭代与策略落地,显著提升平台供需匹配效率与用户留存,为业务规模化增长提供强力支撑。
-
S (Situation)
- 招聘平台(店长直聘、BOSS 直聘、蓝领交付)推荐系统全链路(召回、粗排、精排、重排)存在匹配效率低、多目标平衡不足问题:用户与职位匹配精准度差,B/C 两端转化率低,蓝领交付线索分配依赖人工规则导致入职转化低效,制约业务规模化增长。
-
T (Task)
- 负责三大核心业务线推荐系统全链路建设与优化,通过模型架构设计、样本体系构建、特征工程开发、精细化策略落地,提升供需匹配效率与核心业务指标(DAU、转化率、入职转化)。
-
A (Action)
-
项目一:重排算法
-
算法设计: 负责重排算法的设计与实现,将查看、开聊、回复、达成、拒绝等多种目标进行融合优化,提高推荐结果的精确性和个性化,优化推荐效果。
-
全局寻优: 全局离线寻优,采用粒子群优化算法PSO,根据离线指标的约束,寻找多目标的最优组合。全局在线寻优,用CEM方法,只需定义策略参数和reward,直接优化线上转化目标。
-
个性化寻优: 结合user、user-item等维度特征,用模型学习个性化需求,融合多目标得分。具体方式有:
-
级联模型: PointWise和PairWise两种形式的级联模型(PLE+DeepFM),主次模型解耦,精排层+重排层的级联模型。
-
融合模型: 人工融合和帕累托融合两种形式的融合模型,端到端地通过一个辅助网络学习如何组合不同的目标,模型融合网络输出多目标融合参数。
-
强化学习: 构建四元组(状态S_t、动作A_t、收益Reward_t、状态S_t+1),训练DDPG的Critic和Actor网络,在交互过程中通过学习策略达到回报最大化,是探索和利用的过程。
-
进化策略: 两代(1+1)-ES、每代(1+1)-ES、(1+1)-ES+CEM等多种形式的进化策略,直接优化线上转化率目标。
-
融合评估: 重排算法的AB实验和效果评估,通过离线指标和线上指标,从匹配性、活跃性、多样性等方面,评估推荐结果的准确性和个性化程度,提高用户满意度。
-
项目二:排序算法
-
样本权重: 采用XGBoost和DeepFM等模型,通过设置样本权重,来控制模型多个目标的倾向,样本权重根据样本比例以及模型离线评价指标来调整。使用Focal Loss调整样本权重,处理类别不平衡问题,增强难样本的权重,提高模型的鲁棒性。
-
多任务学习: 结合查看、开聊、回复、达成、拒绝等多种目标学习,具体方式有:
- 排序PairWise模型,让模型学习各个label样本pair对之间的相对顺序。选择优化目标,调整样本pair对的组合方式,根据item1和item2的label,进行损失加权,起到多个目标调和的作用。
- 应用多任务学习框架,ESMM将CTR和CVR结合,解决CVR数据稀疏性问题;MMoE通过多个专家网络和门控机制处理多任务学习问题;PLE通过渐进式分层提取特征实现多任务学习,在模型结构上引入专门的任务特定层和共享层,逐步提取和分离特征,优化排序模型的多目标效果。
-
ID特征: 构建和优化userID和itemID的动态嵌入特征,提升模型的表达能力。利用TFRA的ID Dynamic Embedding技术,捕捉用户和物品的个性化特征,提高排序模型的表现。
-
模型评估: 使用AUC、GAUC(个性化排序,消除请求偏差)、MAP(位置顺序敏感)、TOPN(位置顺序敏感)等指标,评估排序模型的效果,拟合线上的实际效果,便于模型调整优化。
-
项目三:召回算法
-
SimItem: 利用物品相似度进行物品召回,根据物品的共现关系找到相似物品,具体方式有:
-
ALS: 选择用户的查看和开聊行为,根据userid、itemid、score进行ALS计算。通过ALS分解用户-物品交互矩阵,生成用户和物品的隐向量表示,用于计算相似物品。
-
Content: 根据物品属性信息匹配度合计总分,包括距离,相似度,薪资、年龄、学历、公司匹配度等。通过属性信息来计算,扩大相似物品资源池,提高召回覆盖度。
-
Item2Vec: 基于用户行为得到itemid序列,增加side information,如city, position, title等,构造两两pair对item,利用n-gram特征捕捉词内部字符信息,训练fasttext模型,得到item向量。
-
Swing: user-item-user的结构比itemCF的单边结构更稳定,itemCF考察两个物品重合的受众比例有多高,如果很多用户同时喜欢两个物品,判定两个物品相似。Swing额外考虑重合的用户是否来自同一个小圈子,如果overlap(u1, u2)越大,就越要降低权重。
-
向量召回: Mind根据用户行为和用户画像特征,通过胶囊网络生成多个用户兴趣向量。U2U2I从用户到用户再到物品,U2I2I从用户到物品再到物品,结合用户行为序列,计算向量相似度,实现向量召回。
-
策略召回: 基于距离、相似度、活跃度等指标的策略召回,新物品召回,热门物品召回,冷启动物品召回,根据历史行为和偏好的个性化召回等策略。
-
项目四:样本特征
-
数据仓库: 根据曝光日志、特征日志、行为日志等数据源,使用Hadoop和Spark大数据框架,构建全面的数据处理流程,包括清洗数据和ETL工程。通过提取特征和样本,建立高效的数据仓库。确保数据的高质量和一致性,为后续的特征工程和模型训练提供坚实的数据基础。
-
样本指标: 结合实际业务,规范样本标签。增加负向行为指标(如拒绝),细化正向行为指标(如已读),以提高指标的全面性和准确性。将新的样本标签更新到BI系统,并同步更新训练样本中的标签,以确保模型的准确性和稳定性。
-
特征工程: 深入挖掘和开发超过1500个特征,包括BC两端的属性特征、交叉特征(如匹配特征、偏好特征)、内容特征、统计特征、行为特征、序列特征、时间特征、以及距离、相似度和活跃度特征等。涵盖user-item的各个方面,为模型提供丰富的信息。
-
特征选择: 根据特征分析选择特征,具体方式有:XGB特征重要性、皮尔逊相关系数、特征排列重要性(去掉某个特征)、LR特征重要性(添加某个特征)、SHAP等。通过特征选择,去除冗余特征,提高模型的泛化能力,减少过拟合风险。
-
项目五:蓝领交付
-
样本特征: 结合流量侧和分配侧的数据流,构建样本特征表,可视化BI漏斗指标。开发匹配特征、统计特征、偏好特征等。通过特征分析,挖掘用户行为和偏好,提高模型的预测准确性。
-
推荐模型: 构建一个推荐系统来优化交付流程,确保线索资源的最佳分配,包括分级层、分配层、全局匹配层、标签层等。具体内容有:
-
分级层: 线索分级模型,优先分配好线索,提高线索的转化率。以约面、到面、入职为目标,模型从DeepFM迭代到FM,调整超惨,提高模型的准确性。
-
分配层: 通过提高专员和线索的匹配度,提高线索的转化率。根据专员的历史表现和线索的属性特征,构建分配模型,提高线索的匹配度。
-
全局匹配层: 在全局范围内优化匹配,确保总效益最大化,用整数规划Gurobi方法实现。最大化匹配评分,约束条件有可推荐关系约束、专员库容约束、线索分配次数约束。
-
标签层: 通过给优质线索打上显示标签,加强专员的重视程度,提高线索的转化率。展示线索的活跃度、匹配度、优先级等标签,提高专员的工作效率。
-
策略优化: 针对实时线索和待分配线索,采用不同的分配策略。在分配时间、分配次数、线索流转等方面,结合具体业务,优化分配策略,提高线索的转化率和用户满意度。
-
R (Result)
-
店长直聘: B端DAU从10万 → 40万,C端DAU从20万 → 80万,B/C转化率分别提升超100%、150%。
-
BOSS直聘蓝领业务: B端DAU从80万 → 100万,C端DAU从150万 → 200万,B/C转化率分别提升超30%、50%。
-
蓝领交付: 日均20万条线索通过智能分配,入职转化率提升100%+,改善专员负荷均衡性,降低人工成本。
算法工程师 — 必要科技有限公司
2016 — 2018
担任电商平台算法工程师,负责用户画像、数据分析及推荐系统的设计和优化工作。通过精准用户画像和深入数据分析,优化推荐算法和个性化策略,提高推荐系统的准确度和效率。根据用户标签进行精准营销,提升购买率,减少流失率。通过持续的模型优化和策略调整,提升业务目标和用户体验。
-
S (Situation)
- 电商平台推荐系统依赖通用规则,用户与商品匹配精准度低,导致点击率、转化率增长缓慢;营销活动缺乏用户画像支撑,内容同质化严重,用户留存与购买率待提升。
-
T (Task)
- 构建基于用户行为与特征的个性化推荐系统,开发多维度用户画像体系,通过精准推荐与个性化营销提升平台转化效率与用户体验。
-
A (Action)
-
项目一:推荐系统
-
样本指标: 收集商品数据、用户特征数据、用户行为数据等,根据关键指标,如点击率、转化率、浏览时长、购买频率等,生成用于模型训练的样本数据。
-
特征工程: 根据用户的历史行为和偏好,构建用户画像特征,包括用户的年龄、性别、地域、购买偏好、浏览习惯等。结合商品的类别、价格、品牌、销量等特征,构建商品特征。通过特征工程,提高模型的预测准确性。
-
算法模型: 特征预处理,如类别特征one-hot编码,连续特征分桶,数值特征归一化等。使用GBDT和LR等算法,构建推荐模型,根据用户特征和商品特征,预测用户对商品的喜好程度。通过模型训练和调优,提高推荐的准确度和覆盖率。
-
项目二:用户画像
-
用户特征: 整合多个数据源中的用户数据,包括用户基本属性表、客户消费订单表、客户购买类目表、用户访问信息表等,形成用户宽表。根据数据仓库,计算用户扩展属性,如30天购买金额、最近一次消费时间等。
-
模型预测: 根据用户行为数据,提取有价值的特征,训练算法模型,对用户特性进行预测。如是否单身、是否有小孩、是否有车、是否有房等。这些预测结果为精准营销提供重要依据。
-
精准营销: 使用多维组合查询,筛选满足特定条件的目标用户,打上相应的标签,如预流失客户、夜猫子、单身一族、钟情白色、美妆达人等,根据这些标签,设计并推送针对性的营销活动,提高用户购买率和留存率。
-
R (Result)
-
推荐系统: 商品点击率提升 35%+,用户购买转化率提升 25%+,人均浏览时长增加 15%。
-
用户画像: 精准营销贡献销售额占比达 30%,预流失用户挽回率提升 20%。
专业技能
编程语言
多模态算法
大模型开发
推荐算法
数据分析
致谢说明
感谢您花时间阅读我的简历,期待能有机会和您共事。
测试一下