Categories

Agent

  1. 2024-05-24 Agent|手搓一个最小的 Agent 系统 — Tiny Agent

Attention

  1. 2024-07-10 Attention|一文理解Attention:MHA,MQA和GQA

Bert

  1. 2024-02-23 Bert|解读 NLP经典之作 — Bert

Decoder

  1. 2024-10-05 Decoder|Decoder Only 模型的参数量和计算量

Eval

  1. 2024-05-29 Eval|如何评估你的大模型——Tiny Eval

FineTune

  1. 2024-02-17 FineTune|大模型微调技术综述

Flash Attention

  1. 2024-03-03 Flash Attention|flash attention V1 V2 V3 V4 如何加速 attention

Gradio

  1. 2024-02-29 Gradio|Gradio 教程

Growth

  1. 2024-10-08 Growth|金融场景的增长营销

Image

  1. 2024-03-05 Image|解读 文生图技术栈

Llama

  1. 2024-11-02 Llama|Llama 1 2 3 3.1 3.2 系列模型发展
  2. 2024-04-30 Llama|Llama3部署和微调,实践教程(InternStudio 版)

MultiDomain

  1. 2024-08-20 MultiDomain|搜广推之多场景学习

Norm

  1. 2024-10-06 Norm|对比 Batch Norm 和 Layer Norm

Operate

  1. 2024-11-22 Operate|互金项目贷前贷中贷后的运营

Qwen

  1. 2024-05-17 Qwen|深入剖析大模型原理 — Qwen Blog

RAG

  1. 2024-05-20 RAG|纯手工搭建 RAG 框架 — Tiny RAG

Sora

  1. 2024-03-09 Sora|解读 Sora 技术栈
  2. 2024-02-18 Sora|Sora 技术报告

Tokenizer

  1. 2024-02-21 Tokenizer|Andrej Karpathy 的 Let's build the GPT Tokenizer

Video

  1. 2024-04-13 Video|文本生成视频,个性化声音,技术栈 Latte + Sambert + Moviepy
  2. 2024-03-02 Video|一键文本生成视频,非sora,技术栈 TTS + DALL·E + moviepy

nanoGPT

  1. 2024-02-16 nanoGPT|Andrej Karpathy 的 nanoGPT lecture demo 详解