2024 (23)
- Operate|互金项目贷前贷中贷后的运营
- Llama|Llama 1 2 3 3.1 3.2 系列模型发展
- Growth|金融场景的增长营销
- Norm|对比 Batch Norm 和 Layer Norm
- Decoder|Decoder Only 模型的参数量和计算量
- MultiDomain|搜广推之多场景学习
- Attention|一文理解Attention:MHA,MQA和GQA
- Eval|如何评估你的大模型——Tiny Eval
- Agent|手搓一个最小的 Agent 系统 — Tiny Agent
- RAG|纯手工搭建 RAG 框架 — Tiny RAG
- Qwen|深入剖析大模型原理 — Qwen Blog
- Llama|Llama3部署和微调,实践教程(InternStudio 版)
- Video|文本生成视频,个性化声音,技术栈 Latte + Sambert + Moviepy
- Sora|解读 Sora 技术栈
- Image|解读 文生图技术栈
- Flash Attention|flash attention V1 V2 V3 V4 如何加速 attention
- Video|一键文本生成视频,非sora,技术栈 TTS + DALL·E + moviepy
- Gradio|Gradio 教程
- Bert|解读 NLP经典之作 — Bert
- Tokenizer|Andrej Karpathy 的 Let's build the GPT Tokenizer
- Sora|Sora 技术报告
- FineTune|大模型微调技术综述
- nanoGPT|Andrej Karpathy 的 nanoGPT lecture demo 详解