Tips
Go
(18条消息) Go语言自学系列 | golang包_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之channel的遍历_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之select switch_COCOgsta的博客-CSDN博客_golang select switch
(18条消息) Go语言自学系列 | golang并发编程之runtime包_COCOgsta的博客-CSDN博客_golang runtime包
(18条消息) Go语言自学系列 | golang接口值类型接收者和指针类型接收者_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之Timer_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang方法_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之WaitGroup实现同步_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang构造函数_COCOgsta的博客-CSDN博客_golang 构造函数
(18条消息) Go语言自学系列 | golang方法接收者类型_COCOgsta的博客-CSDN博客_golang 方法接收者
(18条消息) Go语言自学系列 | golang接口_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang接口和类型的关系_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang结构体_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang结构体_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang标准库os模块 - File文件读操作_COCOgsta的博客-CSDN博客_golang os.file
(18条消息) Go语言自学系列 | golang继承_COCOgsta的博客-CSDN博客_golang 继承
(18条消息) Go语言自学系列 | golang嵌套结构体_COCOgsta的博客-CSDN博客_golang 结构体嵌套
(18条消息) Go语言自学系列 | golang并发编程之Mutex互斥锁实现同步_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发变成之通道channel_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之原子操作详解_COCOgsta的博客-CSDN博客_golang 原子操作
(18条消息) Go语言自学系列 | golang并发编程之原子变量的引入_COCOgsta的博客-CSDN博客_go 原子变量
(18条消息) Go语言自学系列 | golang并发编程之协程_COCOgsta的博客-CSDN博客_golang 协程 并发
(18条消息) Go语言自学系列 | golang接口嵌套_COCOgsta的博客-CSDN博客_golang 接口嵌套
(18条消息) Go语言自学系列 | golang包管理工具go module_COCOgsta的博客-CSDN博客_golang 包管理器
(18条消息) Go语言自学系列 | golang标准库os模块 - File文件写操作_COCOgsta的博客-CSDN博客_go os模块
(18条消息) Go语言自学系列 | golang结构体的初始化_COCOgsta的博客-CSDN博客_golang 结构体初始化
(18条消息) Go语言自学系列 | golang通过接口实现OCP设计原则_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang标准库os包进程相关操作_COCOgsta的博客-CSDN博客_golang os包
(18条消息) Go语言自学系列 | golang标准库ioutil包_COCOgsta的博客-CSDN博客_golang ioutil
(18条消息) Go语言自学系列 | golang标准库os模块 - 文件目录相关_COCOgsta的博客-CSDN博客_go语言os库
Golang技术栈,Golang文章、教程、视频分享!
(18条消息) Go语言自学系列 | golang结构体指针_COCOgsta的博客-CSDN博客_golang 结构体指针
Ansible
太厉害了,终于有人能把Ansible讲的明明白白了,建议收藏_互联网老辛
ansible.cfg配置详解
Docker
Docker部署
linux安装docker和Docker Compose
linux 安装 docker
Docker中安装Docker遇到的问题处理
Docker常用命令
docker常用命令小结
docker 彻底卸载
Docker pull 时报错:Get https://registry-1.docker.io/v2/library/mysql: net/http: TLS handshake timeout
Docker 拉镜像无法访问 registry-x.docker.io 问题(Centos7)
docker 容器内没有权限
Linux中关闭selinux的方法是什么?
docker run 生成 docker-compose
Docker覆盖网络部署
docker pull后台拉取镜像
docker hub
Redis
Redis 集群别乱搭,这才是正确的姿势
linux_离线_redis安装
怎么实现Redis的高可用?(主从、哨兵、集群) - 雨点的名字 - 博客园
redis集群离线安装
always-show-logo yes
Redis集群搭建及原理
[ERR] Node 172.168.63.202:7001 is not empty. Either the nodealready knows other nodes (check with CLUSTER NODES) or contains some - 亲爱的不二999 - 博客园
Redis daemonize介绍
redis 下载地址
Redis的redis.conf配置注释详解(三) - 云+社区 - 腾讯云
Redis的redis.conf配置注释详解(一) - 云+社区 - 腾讯云
Redis的redis.conf配置注释详解(二) - 云+社区 - 腾讯云
Redis的redis.conf配置注释详解(四) - 云+社区 - 腾讯云
Linux
在终端连接ssh的断开关闭退出的方法
漏洞扫描 - 灰信网(软件开发博客聚合)
find 命令的参数详解
vim 编辑器搜索功能
非root安装rpm时,mockbuild does not exist
Using a SSH password instead of a key is not possible because Host Key checking
(9条消息) 安全扫描5353端口mDNS服务漏洞问题_NamiJava的博客-CSDN博客_5353端口
Linux中使用rpm命令安装rpm包
ssh-copy-id非22端口的使用方法
How To Resolve SSH Weak Key Exchange Algorithms on CentOS7 or RHEL7 - infotechys.com
Linux cp 命令
yum 下载全量依赖 rpm 包及离线安装(终极解决方案) - 叨叨软件测试 - 博客园
How To Resolve SSH Weak Key Exchange Algorithms on CentOS7 or RHEL7 - infotechys.com
RPM zlib 下载地址
运维架构网站
欢迎来到 Jinja2
/usr/local/bin/ss-server -uv -c /etc/shadowsocks-libev/config.json -f /var/run/s
ruby 安装Openssl 默认安装位置
Linux 常用命令学习 | 菜鸟教程
linux 重命名文件和文件夹
linux命令快速指南
ipvsadm
Linux 下查找日志中的关键字
Linux 切割大 log 日志
CentOS7 关于网络的设置
rsync 命令_Linux rsync 命令用法详解:远程数据同步工具
linux 可视化界面安装
[问题已处理]-执行yum卡住无响应
GCC/G++升级高版本
ELK
Docker部署ELK
ELK+kafka+filebeat+Prometheus+Grafana - SegmentFault 思否
(9条消息) Elasticsearch设置账号密码_huas_xq的博客-CSDN博客_elasticsearch设置密码
Elasticsearch 7.X 性能优化
Elasticsearch-滚动更新
Elasticsearch 的内存优化_大数据系统
Elasticsearch之yml配置文件
ES 索引为Yellow状态
Logstash:Grok filter 入门
logstash grok 多项匹配
Mysql
Mysql相关Tip
基于ShardingJDBC实现数据库读写分离 - 墨天轮
MySQL-MHA高可用方案
京东三面:我要查询千万级数据量的表,怎么操作?
OpenStack
(16条消息) openstack项目中遇到的各种问题总结 其二(云主机迁移、ceph及扩展分区)_weixin_34104341的博客-CSDN博客
OpenStack组件介绍
百度大佬OpenStack流程
openstack各组件介绍
OpenStack生产实际问题总结(一)
OpenStack Train版离线部署
使用Packstack搭建OpenStack
K8S
K8S部署
K8S 集群部署
kubeadm 重新 init 和 join-pudn.com
Kubernetes 实战总结 - 阿里云 ECS 自建 K8S 集群 Kubernetes 实战总结 - 自定义 Prometheus
【K8S实战系列-清理篇1】k8s docker 删除没用的资源
Flannel Pod Bug汇总
Java
Jdk 部署
JDK部署
java线程池ThreadPoolExecutor类使用详解 - bigfan - 博客园
ShardingJDBC实现多数据库节点分库分表 - 墨天轮
Maven Repository: Search/Browse/Explore
其他
Git在阿里,我们如何管理代码分支?
chrome F12调试网页出现Paused in debugger
体验IntelliJ IDEA的远程开发(Remote Development) - 掘金
Idea远程调试
PDF转MD
强哥分享干货
优秀开源项目集合
vercel 配合Github 搭建项目Doc门户
如何用 Github Issues 写技术博客?
Idea 2021.3 Maven 3.8.1 报错 Blocked mirror for repositories 解决
列出maven依赖
[2022-09 持续更新] 谷歌 google 镜像 / Sci-Hub 可用网址 / Github 镜像可用网址总结
阿里云ECS迁移
linux访问github
一文教你使用 Docker 启动并安装 Nacos-腾讯云开发者社区-腾讯云
Nginx
Nginx 部署
Nginx 部署安装
Nginx反向代理cookie丢失的问题_longzhoufeng的博客-CSDN博客_nginx 代理后cookie丢失
Linux 系统 Https 证书生成与Nginx配置 https
数据仓库
实时数仓
松果出行 x StarRocks:实时数仓新范式的实践之路
实时数据仓库的一些分层和分层需要处理的事情,以及数据流向
湖仓一体电商项目
湖仓一体电商项目(一):项目背景和架构介绍
湖仓一体电商项目(二):项目使用技术及版本和基础环境准备
湖仓一体电商项目(三):3万字带你从头开始搭建12个大数据项目基础组件
数仓笔记
数仓学习总结
数仓常用平台和框架
数仓学习笔记
数仓技术选型
尚硅谷教程
尚硅谷学习笔记
尚硅谷所有已知的课件资料
尚硅谷大数据项目之尚品汇(11数据质量管理V4.0)
尚硅谷大数据项目之尚品汇(10元数据管理AtlasV4.0)
尚硅谷大数据项目之尚品汇(9权限管理RangerV4.0)
尚硅谷大数据项目之尚品汇(8安全环境实战V4.0)
尚硅谷大数据项目之尚品汇(7用户认证KerberosV4.1)
尚硅谷大数据项目之尚品汇(6集群监控ZabbixV4.1)
尚硅谷大数据项目之尚品汇(5即席查询PrestoKylinV4.0)
尚硅谷大数据项目之尚品汇(4可视化报表SupersetV4.0)
尚硅谷大数据项目之尚品汇(3数据仓库系统)V4.2.0
尚硅谷大数据项目之尚品汇(2业务数据采集平台)V4.1.0
尚硅谷大数据项目之尚品汇(1用户行为采集平台)V4.1.0
数仓治理
数据中台 元数据规范
数据中台的那些 “经验与陷阱”
2万字详解数据仓库数据指标数据治理体系建设方法论
数据仓库,为什么需要分层建设和管理? | 人人都是产品经理
网易数帆数据治理演进
数仓技术
一文看懂大数据生态圈完整知识体系
阿里云—升舱 - 数据仓库升级白皮书
最全企业级数仓建设迭代版(4W字建议收藏)
基于Hue,Dolphinscheduler,HIVE分析数据仓库层级实现及项目需求案例实践分析
详解数据仓库分层架构
数据仓库技术细节
大数据平台组件介绍
总览 2016-2021 年全球机器学习、人工智能和大数据行业技术地图
Apache DolphinScheduler 3.0.0 正式版发布!
数据仓库面试题——介绍下数据仓库
数据仓库为什么要分层,各层的作用是什么
Databend v0.8 发布,基于 Rust 开发的现代化云数据仓库 - OSCHINA - 中文开源技术交流社区
数据中台
数据中台设计
大数据同步工具之 FlinkCDC/Canal/Debezium 对比
有数数据开发平台文档
Shell
Linux Shell 命令参数
shell 脚本编程
一篇教会你写 90% 的 Shell 脚本
Kibana
Kibana 查询语言(KQL)
Kibana:在 Kibana 中的四种表格制作方式
Kafka
Kafka部署
canal 动态监控 Mysql,将 binlog 日志解析后,把采集到的数据发送到 Kafka
OpenApi
OpenAPI 标准规范,了解一下?
OpenApi学术论文
贵阳市政府数据开放平台设计与实现
OpenAPI简介
开放平台:运营模式与技术架构研究综述
管理
技术部门Leader是不是一定要技术大牛担任?
华为管理体系流程介绍
DevOps
*Ops
XOps 已经成为一个流行的术语 - 它是什么?
Practical Linux DevOps
Jenkins 2.x实践指南 (翟志军)
Jenkins 2权威指南 ((美)布伦特·莱斯特(Brent Laster)
DevOps组件高可用的思路
KeepAlived
VIP + KEEPALIVED + LVS 遇到Connection Peer的问题的解决
MinIO
MinIO部署
Minio 分布式集群搭建部署
Minio 入门系列【16】Minio 分片上传文件 putObject 接口流程源码分析
MinioAPI 浅入及问题
部署 minio 兼容 aws S3 模式
超详细分布式对象存储 MinIO 实战教程
Hadoop
Hadoop 部署
Hadoop集群部署
windows 搭建 hadoop 环境(解决 HADOOP_HOME and hadoop.home.dir are unset
Hadoop 集群搭建和简单应用(参考下文)
Hadoop 启动 NameNode 报错 ERROR: Cannot set priority of namenode process 2639
jps 命令查看 DataNode 进程不见了 (hadoop3.0 亲测可用)
hadoop 报错: Operation category READ is not supported in state standby
Spark
Spark 部署
Spark 集群部署
spark 心跳超时分析 Cannot receive any reply in 120 seconds
Spark学习笔记
apache spark - Failed to find data source: parquet, when building with sbt assembly
Spark Thrift Server 架构和原理介绍
InLong
InLong 部署
Apache InLong部署文档
安装部署 - Docker 部署 - 《Apache InLong v1.2 中文文档》 - 书栈网 · BookStack
基于 Apache Flink SQL 的 InLong Sort ETL 方案解析
关于 Apache Pulsar 在 Apache InLong 接入数据
zookeeper
zookeeper 部署
使用 Docker 搭建 Zookeeper 集群
美团技术团队
StarRocks
StarRocks技术白皮书(在线版)
JuiceFS
AI 场景存储优化:云知声超算平台基于 JuiceFS 的存储实践
JuiceFS 在 Elasticsearch/ClickHouse 温冷数据存储中的实践
JuiceFS format
元数据备份和恢复 | JuiceFS Document Center
JuiceFS 元数据引擎选型指南
Apache Hudi 使用文件聚类功能 (Clustering) 解决小文件过多的问题
普罗米修斯
k8s 之 Prometheus(普罗米修斯)监控,简单梳理下 K8S 监控流程
k8s 部署 - 使用helm3部署监控prometheus(普罗米修斯),从零到有,一文搞定
k8s 部署 - 使用 helm3 部署监控 prometheus(普罗米修斯),从零到有,一文搞定
k8s 部署 - 如何完善 k8s 中 Prometheus(普罗米修斯)监控项目呢?
k8s 部署 - k8s 中 Prometheus(普罗米修斯)的大屏展示 Grafana + 监控报警
zabbix
一文带你掌握 Zabbix 监控系统
Stream Collectors
Nvidia
Nvidia API
CUDA Nvidia驱动安装
NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
ubuntu 20 CUDA12.1安装流程
nvidia开启持久化模式
nvidia-smi 开启持久化
Harbor
Harbor部署文档
Docker 爆出 it doesn't contain any IP SANs
pandoc
其他知识
大模型
COS 597G (Fall 2022): Understanding Large Language Models
如何优雅的使用各类LLM
ChatGLM3在线搜索功能升级
当ChatGLM3能用搜索引擎时
OCR神器,PDF、数学公式都能转
Stable Diffusion 动画animatediff-cli-prompt-travel
基于ERNIE Bot自定义虚拟数字人生成
pika负面提示词
开通GPT4的方式
GPT4网站
低价开通GPT Plus
大模型应用场景分享
AppAgent AutoGPT变体
机器学习
最大似然估计
权衡偏差(Bias)和方差(Variance)以最小化均方误差(Mean Squared Error, MSE)
伯努利分布
方差计算公式
均值的高斯分布估计
没有免费午餐定理
贝叶斯误差
非参数模型
最近邻回归
表示容量
最优容量
权重衰减
正则化项
Sora
Sora官方提示词
看完32篇论文,你大概就知道Sora如何炼成? |【经纬低调出品】
Sora论文
Sora 物理悖谬的几何解释
Sora 技术栈讨论
RAG垂直落地
DB-GPT与TeleChat-7B搭建相关RAG知识库
ChatWithRTX
ChatRTX安装教程
ChatWithRTX 踩坑记录
ChatWithRTX 使用其他量化模型
ChatWithRTX介绍
RAG 相关资料
英伟达—大模型结合 RAG 构建客服场景自动问答
又一大模型技术开源!有道自研RAG引擎QAnything正式开放下载
收藏!RAG入门参考资料开源大总结:RAG综述、介绍、比较、预处理、RAG Embedding等
RAG调研
解决现代RAG实际生产问题
解决现代 RAG 系统中的生产问题-II
Modular RAG and RAG Flow: Part Ⅰ
Modular RAG and RAG Flow: Part II
先进的Retriever技术来增强你的RAGs
高级RAG — 使用假设文档嵌入 (HyDE) 改进检索
提升 RAG:选择最佳嵌入和 Reranker 模型
LangGraph
增强型RAG:re-rank
LightRAG:使用 PyTorch 为 LLM 应用程序提供支持
RAG 101:分块策略
模型训练
GPU相关资料
[教程] conda安装简明教程(基于miniconda和Windows)
PyTorch CUDA对应版本 | PyTorch
资料
李一舟课程全集
零碎资料
苹果各服共享ID
数据中心网络技术概览
华为大模型训练学习笔记
百度AIGC工程师认证考试答案(可换取工信部证书)
百度智能云生成式AI认证工程师 考试和证书查询指南
深入理解 Megatron-LM(1)基础知识
QAnything
接入QAnything的AI问答知识库,可私有化部署的企业级WIKI知识库
wsl --update失效Error code: Wsl/UpdatePackage/0x80240438的解决办法
Docker Desktop 启动docker engine一直转圈解决方法
win10开启了hyper-v,docker 启动还是报错 docker desktop windows hypervisor is not present
WSL虚拟磁盘过大,ext4迁移 Windows 中创建软链接和硬链接
WSL2切换默认的Linux子系统
Windows的WSL子系统,自动开启sshd服务
新版docker desktop设置wsl(使用windown的子系统)
WSL 开启ssh
Windows安装网易开源QAnything打造智能客服系统
芯片
国内互联网大厂自研芯片梳理
超算平台—算力供应商
Linux 磁盘扩容
Linux使用growpart工具进行磁盘热扩容(非LVM扩容方式)
关于centos7 扩容提示no tools available to resize disk with 'gpt' - o夜雨随风o - 博客园
(小插曲)neo4j配置apoc插件后检查版本发现:Unknown function ‘apoc.version‘ “EXPLAIN RETURN apoc.version()“
vfio-pci与igb_uio映射硬件资源到DPDK的流程分析
KubeVirt
vnc server配置、启动、重启与连接 - 王约翰 - 博客园
虚拟机Bug解决方案
kubevirt 如何通过CDI上传镜像文件
在 K8S 上也能跑 VM!KubeVirt 簡介與建立(部署篇) | Cloud Solutions
KubeVirt 04:容器化数据导入 – 小菜园
Python
安装 flash_attn
手把手教你在linux上安装pytorch与cuda
AI
在启智社区基于PyTorch运行国产算力卡的模型训练实验
Scaling law
免费的GPT3.5 API
AI Engineer Roadmap & Resources 🤖
模型排行
edk2
K8S删除Evicted状态的pod
docker 中启动 docker
远程本地多用户桌面1.17(一种不让电脑跟你抢键鼠的思路) - 哔哩哔哩
华为鲲鹏服务器(ARM架构)部署Prometheus
在Linux上安装配置Grafana_AI开发平台ModelArts_华为云
abrt-ccpp干崩服务器查询记录
kubevirt 中文社区
VNCServer 连接方法
Pod创建流程代码版本[kubelet篇]
[译]深入剖析 Kubernetes MutatingAdmissionWebhook-腾讯云开发者社区-腾讯云
[译]深入剖析 Kubernetes MutatingAdmissionWebhook-腾讯云开发者社区-腾讯云
深入理解 Kubernetes Admission Webhook-阳明的博客
CentOS7 安装 mbedtls和mbedtls-devel
docker in docker 启动命令
go 协程泄漏 pprof
-
+
首页
国内互联网大厂自研芯片梳理
# 国内互联网大厂自研芯片梳理 ## 1.1 阿里巴巴 **平头哥半导体有限公司** 于 2018 年 9 月宣布成立,是阿里巴巴集团的全资半导体芯片业务主体。平头哥拥有端云一体全栈产品系列,涵盖数据中心芯片、IoT 芯片等,实现芯片端到端设计链路全覆盖。 2019 年 9 月 25 日的杭州云栖大会上,阿里巴巴第一颗自研芯片正式问世。**含光 800 推理性能达到 78563IPS**,比 2019 年业界最好的 AI 芯片性能高 4 倍;能效比 500IPS/W,是第二名的 3.3 倍。含光 800 性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对 CNN 及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗 NPU 上完成计算。 ![img](https://yg9538.kmgy.top/202404060940002.png) 在 2021 年 10 月 19 日云栖大会上,平头哥发布旗下首颗 Arm 服务器芯片**倚天 710**。倚天 710 由平头哥自主设计研发,采用先进架构,具备高性能、高能效、高带宽等特点,性能业界领先。该芯片采用 2.5D 封装,分为两个 DIE,总计 600 亿晶体管。包含 128 个 Armv9 高性能 CPU 核,每个 CPU 核心配置 64KB 一级指令缓存,64KB 一级数据缓存,以及 1MB 二级缓存,片上集成 128MB 系统缓存。内存子系统配置 8 通道 DDR5,峰值总带宽达到 281GB/s ,1/0 子系统含 96 通道 Pcle5.0,双向理论总带宽达到 768GB/s。截至 2023 年,**该芯片已在阿里云数据中心规模化部署,算力性价比提升超 30%,已服务数千家电商、短视频、在线教育等领域客户。** ![img](https://yg9538.kmgy.top/202404060940143.png) **倚天 710** ![](https://yg9538.kmgy.top/202404060940019.png) **羽阵 600 芯片架构** 同时在该会上发布的还有 RFID 电子标签芯片**羽阵 600**,这是一款面向物联网场景的感知芯片,它具备高读取灵敏度、全方位读取以及强环境适应性等特征,适用于智慧物流、智慧仓储、智慧零售、资产管理等场景。目前该芯片已在菜鸟物流场景规模化应用。 2022 年 11 月的国际物联网展上,平头哥发布面向万物互联场景的超高频 RFID 电子标签芯片**羽阵 611 和羽阵 612**。两款芯片性能、稳定性、一致性和环境适应性均达到业界领先水平,可满足商超零售、智慧物流、供应链、航空包裹跟踪、资产管理等复杂场景下的高识别率要求。**羽阵 611 是一款单端口芯片,灵敏度达到业界领先的-24dBm,配合全自动阻抗调谐,适用于商超零售、智慧物流、供应链、航空包裹跟踪、资产管理等多种场景,大幅提升生产和盘点效率**;羽阵 612:采用双端口全向天线设计,灵敏度达到-24dBm,具备更好的通用性,能够满足货物堆叠、遮挡等复杂场景的需求。 ![img](https://yg9538.kmgy.top/202404060940221.png) 2023 年 11 月 1 日,在 2023 云栖大会上,阿里巴巴平头哥发布旗下首颗 SSD 主控芯片**镇岳 510**,该芯片为云计算场景深度定制,实现 4μs 超低时延,比业界主流降低 30%以上,误码率低至 10-18,比业内标杆领先一个数量级。**镇岳 510 将率先在阿里云数据中心部署,可应用于 AI、在线交易、大数据分析、高性能数据库、软件定义存储等业务场景。**镇岳 510 集成了多项创新技术,使用平头哥自研芯片架构,采用 RISC-V 架构玄铁 910 多核 CPU 系统,内置大量自研硬件加速模块,有效平衡性能与功耗;在内存和接口方面,支持业界最领先的 DDR5、PCIe 5.0 技术,大幅提升芯片的数据吞吐速率;在可靠性方面,通过自研 LDPC 纠错算法与介质电压预测算法,误码率比业内标杆领先 1 个数量级。**此次镇岳 510 的问世,意味着平头哥的芯片产品家族从算力扩展到了存力领域,进一步为云计算行业提供高性价比的技术底座。** ## 1.2 腾讯 2021 年 11 月 3 日,在位于武汉的腾讯数字生态大会上,腾讯宣布已在三款自研芯片上取得进展,分别是 AI 推理芯片“紫霄”、视频转码芯片“沧海”和智能网卡芯片“玄灵”。 **紫霄 AI 推理芯片** 最显著的特点是**结合图片和视频处理、自然语言处理、搜索推荐等场景**,通过采用 2.5D 封装技术合封 HBM2e 内存与 AI 核心,以及**在芯片内部增加计算机视觉 CV 加速器和视频编解码加速器等创新措施**,对芯片架构进行了优化,打破了制约芯片算力发挥的瓶颈点。 **沧海转码芯片** 在算法上完整实现了**高精度运动搜索、全率失真优化、高效自适应量化等所有主流编码工具,并融合了腾讯云软件编码器码率控制等方面的领先技术**;同时,沧海通过灵活的多核扩展架构、高性能编码流水线、层级化 Memory 布局等技术,也能够有效满足业务高吞吐、低时延和实时的要求。 **玄灵智能网卡芯片** 则定位于**云主机的性能加速,结合 CVM/BM/容器等场景优化芯片架构,将原来运行在主 CPU 上的虚拟化、网络/存储 IO 等功能下移到芯片,实现了主 CPU 的 0 占用。** ![img](https://yg9538.kmgy.top/202404060941873.png) 腾讯公司副总裁、云与智慧产业 COO 兼腾讯云总裁邱跃鹏表示,AI 推理芯片紫霄的性能相比业界提升 100%,2021 年已经流片成功并顺利点亮;视频转码芯片沧海的压缩率相比业界提升 30%以上;智能网卡芯片玄灵的性能相比业界产品提升 4 倍。之外,腾讯还将通过生态共建,与国内外芯片企业保持深度战略合作,把芯片的定制化能力和软件的定制化能力结合起来,获得最优的性能和最佳的性价比,确保给客户提供更多元化和更适配的选择。 ![img](https://yg9538.kmgy.top/202404060941643.png) **腾讯在自研芯片领域的研发和应用正在不断加速:视频编解码芯片“沧海”,已经量产并投用数万片,并在云游戏、直点播等场景中,面向腾讯自研业务和公有云客户提供服务。**2023 年 4 月,在莫斯科国立大学举办的 MSU 硬件视频编码比赛中,腾讯沧海芯片包揽了所参加的两个赛道 8 项评分的全部第一,遥遥领先于行业 GPU 等标品硬件。沧海芯片已在业务场景中投用数万片,服务腾讯自研业务及公有云客户。高性能网络芯片“玄灵”,采用自研的网络、存储、计算加速方案,实现主机 CPU 的“0”占用及高达 4 倍的性能提升,助力打造下一代高性能网络基础设施。自研 AI 推理芯片“紫霄”,已经量产并在多个头部业务落地,目前在腾讯会议实时字幕上已实现全量上线,单卡紫霄机器负载可达到 T4 的 4 倍,并将超时率从 0.005%降低至 0。 ![img](https://yg9538.kmgy.top/202404060941563.png) ![img](https://yg9538.kmgy.top/202404060941062.png) ## 1.3 百度 在 2018 百度 AI 开发者大会上,百度面向开发者发布了中国首款云端全功能 AI 芯片“昆仑”,**包含训练芯片“昆仑 818-300”和推理芯片“昆仑 818-100”**。除了常用深度学习算法等云端需求,还能适配诸如自然语言处理、大规模语音识别、自动驾驶、大规模推荐等具体终端场景的计算需求。2019 年下半年芯片流片成功。截至目前,实现量产的百度昆仑 1 已在百度搜索引擎及云计算用户部署 2 万片。 ![img](https://yg9538.kmgy.top/202404060941415.png) 2021 年 4 月,前身为百度智能芯片及架构部的昆仑芯(北京)科技有限公司完成独立融资,首轮估值约 130 亿元。公司团队在国内最早布局 AI 加速领域,深耕十余年,是一家在体系结构、芯片实现、软件系统和场景应用均有深厚积累的 AI 芯片企业。 2021 年百度世界大会上,百度宣布自主研发的第二代百度昆仑 AI 芯片——**昆仑芯 2** 实现量产,昆仑芯 2 采用 7nm 制程,搭载自研的第二代 XPU 架构,相比一代性能提升 2-3 倍,适用云、端、边等多场景,可应用于互联网、智慧城市、智慧工业等领域,还将赋能高性能计算机集群、生物计算、智能交通、自动驾驶等更广泛空间。值得一提的是,百度昆仑 AI 芯片针对语音、自然语言处理、图像等 AI 技术专门优化,支持飞桨等深度学习框架,使得 AI 模型计算效率更高、效果更好。 ## 1.4 字节跳动 2023 年 8 月 22 日, **火山引擎视频云&AIGC 大会以“视象新生”为主题, 发布 了自研的视频编解码芯片。**经验证, 此次大会发布的火山引擎自研视频编解码芯 片,其压缩效率相比行业主流硬件编码器提升 30%以上, **可应用于视频点播、直 播、图像压缩、 XR 等业务场景。与具备通用计算能力的 CPU 芯片相比,火山引 擎自研芯片仅支持视频编解码任务,因此能够在视频处理场景具备更高的计算密 度。**一台芯片服务器的转码能力与百台 CPU 服务器相当。简单来说, 在 4K/8K 超 高清、高帧率场景中,相对软件编码,火山引擎这款视频编解码芯片能实现低延 时的高质量转码,针对观看人数比较小的中长尾直播,可以节省大量算力成本。 用户端的感受则是更高质的画面和更低延时。 火山引擎硬件编码能力此前在世界编码器大赛 MSU 中夺得多项第一,达到 行业领先水平。此次自研视频编解码芯片的发布, 有望大幅提升 4K 超高清应用 场景的编码速度,保证较高的视频主客观质量,大幅降低 4K 编码计算成本,推 动更多 4K 应用的不断普及。 风险提示:自研芯片进展不及预期的风险。 # 国外AI自研芯片 ## 2.1 微软 在微软 Ignite 2023 技术大会上,微软推出了两款自研的 AI 芯片:**Microsoft Azure Maia 和 Azure Cobalt**。Azure Maia 是一款 AI 加速器芯片,用于 OpenAI 模型、Bing、GitHub Copilot 和 ChatGPT 等 AI 工作负载的云端训练和推理。Azure Cobalt 是基于 Arm 架构的云原生芯片,优化了通用工作负载的性能、功率和成本效益。Maia 100 作为系列的第一代产品,拥有 1050 亿个晶体管,是采用 5nm 制程技术的最大芯片之一。 这些芯片预计将在明年初开始在微软数据中心投入使用,为 Microsoft Copilot 和 Azure OpenAI Service 等服务提供动力。 ![img](https://yg9538.kmgy.top/202404060941968.png) ## 2.2 谷歌自研TPU芯片 谷歌在 2016 年 I/O 大会上发布了 TPU(Tensor Processing Unit),专门为机器学习和 Tensorflow 量身定做的芯片。随后,谷歌又发布了 TPU v2、TPU v3,并在 2021 年发布了 **TPU v4,提供了千万亿次级的机器学习性能。** **2023 年 12 月,作为 v4 TPU 的继任者, TPU v5p 发布。**v5p 针对大规模训 练进行了优化, 并且是开发基础 LLM、扩散模型和生成式 AI 的领先平台。概括 来讲, v5p 可提供高达 v4 的性能的 2 倍,同时还能在 Pod 中容纳多出 2 倍 的 TPU(v4 中的最大切片是 6000 个,而 v4 中则为 3000 个),从而在 Pod 级 别实现高达 4 倍的性能。它还以更高的时钟频率(1.75Ghz 与 1.05Ghz)运行, 为大规模嵌入添加了 SparseCore,并将高带宽内存(HBM)容量提高至原来的 3 倍。 每个 **TPU v5p Pod 由多达 8960 个芯片组成**,使用最高带宽的芯片间连接 (每芯片 4800 Gbps)进行互连,确保快速传输速度和最佳性能。在 AI 性能方面, **TPU v5p 能够提供 459 teraFLOPS(每秒可执行 459 万亿次浮点运算)的 bfloat16 (16 位浮点数格式)性能或 918 teraOPS(每秒可执行 918 万亿次整数运算)的 Int8(执行 8 位整数) 性能, 支持 95GB 的高带宽内存, 能够以 2.76 TB/s 的速度 传输数据**。与 TPU v4 相比,新发布的 TPU v5p 具有两倍的 FLOPS(每秒浮点运算) 和三倍的高内存带宽提升,这在人工智能领域是令人惊叹的。 此外, 在模型训练方面, TPU v5p 在 LLM(大语言模型) 训练速度上显示出 2.8 倍的代际提升。Google 还挤出更多的计算能力,因为 TPU v5p“就每个 Pod 的 总可用 FLOP 而言,可扩展性比 TPU v4 高 4 倍”。 ![img](https://yg9538.kmgy.top/202404060941661.png) ![img](https://yg9538.kmgy.top/202404060941456.png) ## 2.3 Meta自研AI芯片 2023 年 5 月,**Meta 发布其第一代基于 7nm 工艺的自研 AI 芯片 MTIA(MTIA v1)**,Meta 将该 AI 芯片称为 Meta Training and Inference Accelerator,简称 MTIA, 并将其描述为加速 AI 训练和推理工作负载的 AI 芯片“ 家族” 的一部分。 MTIA 是 一种 ASIC ,一种将不同电路组合在一块基板上的芯片,允许对其进行编程以并 行执行一项或多项任务。MTIA v1 基于 7 纳米工艺,可以从其内部 128 MB 内 存扩展到高达 128 GB。Meta 表示, **MTIA 可以专门用于处理与 AI 推荐系统相关 的工作,其计算性能和处理效率都胜过 CPU**。另外,在 Meta 设计的基准测试 中, MTIA 处理“低复杂性” ”和“ 中等复杂度” 的 AI 模型也比 GPU 更高效。 除了 MTIA ,Meta 还在开发另一种芯片来处理特定类型的计算工作负载。这 款芯片被称为 Meta 可扩展视频处理器(Meta Scalable Video Processor), 简称 MSVP,它是 Meta 内部开发的第一个专用集成电路(ASIC)解决方案, **专为应对 视频点播和流播的处理需求而设计。 Meta 表示, 该公司的计划是最终将大部分 “稳定而成熟” 的视频处理工作负载转移给 MSVP,只对需要特定定制和“ 显著”提 高质量的工作负载使用软件视频编码。**Meta 还称,通过智能去噪和图像增强等 预处理方法,以及伪影去除和超分辨率等后期处理方法, MSVP 持续助力提高视 频质量。 ![img](https://yg9538.kmgy.top/202404060942602.png) ![img](https://yg9538.kmgy.top/202404060942034.png) # 总结 我们认为, 海内外互联网大厂在自研芯片领域的深入投入, 也能从侧面彰显 算力在人工智能发展中的重要地位, 伴随相关算力技术的持续发展, 人工智能整 个领域发展速度也有望持续加速,从而推动人工智能技术在千行百业的广泛落 地。
yg9538
2024年4月6日 09:48
576
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码