Tips


  • 简介
  • 目录大纲
  • 最新文档
  • 文集下载

    mindie相关参数收集

    oom MINDIE_LLM_USE_MB_SWAPPER

    yg9538 - 2025年4月22日 13:43


    模型推理标准api

    https://github.com/labring/FastGPT/blob/main/plugins/model/rerank-bge/bge-reranker-v2-m3/app.py

    yg9538 - 2025年4月22日 10:09


    cusor

    氛围编程提示词 一步一步处理 一个一个方法修改,如果无法修改多次回复

    yg9538 - 2025年4月18日 10:58


    671B DeepSeek

    今天要记录的是 671B DeepSeek 模型的本地部署,也就是所谓满血版,不是网络 API 调用,也不是 70B (含)以下蒸馏模型的本地部署(这个因为就是 llama/qwen 模型的结构不存在太多问题)。计划是在一台机器上部署,不是跨机器分布式运行。 首先,671B 模型,应该是用 fp8 精度下训练的,所以其全量模型理论值就是 671GB ,最常见的主流 A100 x8 的机器显存是放不……

    yg9538 - 2025年3月4日 15:54


    2025 年工作

    昇腾 NPU 虚拟化界面 云原生相关的 npu 直通完成 趋动科技竞品比较

    yg9538 - 2025年3月3日 10:29



    yg9538