☁️ 基础设施与部署
Hardware integration, cloud infra, and model serving.
当前分类已收录 869 个相关项目。
Cloud & Hosting
netdata
AI驱动的全栈可观测性平台,提供实时监控和智能告警功能。支持容器、Kubernetes等多种环境的自动化运维。
- Stars: ⭐️ 78.5k
- Tags:
ObservabilityMonitoringMachine Learning - 最后活动时间: 2026-04-18
daytona
专为AI智能体设计的安全沙箱基础设施,提供代码执行能力和隔离环境,保障AI生成代码的安全运行。
- Stars: ⭐️ 72.4k
- Tags:
AI沙箱代码执行基础设施 - 最后活动时间: 2026-04-18
appwrite
完整的云端基础设施平台,支持Web、移动和AI应用开发,包含认证、数据库、存储等服务。
- Stars: ⭐️ 55.8k
- Tags:
backend-as-a-servicecloudserverlessai-infrastructure - 最后活动时间: 2026-04-18
kong
云原生API和AI网关,支持LLM请求路由、MCP协议和OpenAI代理,统一管理AI应用流量。
- Stars: ⭐️ 43.2k
- Tags:
API GatewayAI GatewayLLM - 最后活动时间: 2026-03-27
spark
Apache Spark统一大数据分析引擎,内置MLlib机器学习库,支持大规模数据处理和AI模型训练。
- Stars: ⭐️ 43.2k
- Tags:
big-datamachine-learningdata-processingdistributed-computing - 最后活动时间: 2026-04-18
data-engineer-handbook
数据工程师学习资源大全,涵盖Spark、大数据处理、SQL等核心技术。为AI/ML数据管道构建提供重要基础设施知识。
- Stars: ⭐️ 41.0k
- Tags:
data-engineeringbigdataapachesparksql - 最后活动时间: 2026-04-02
1Panel
现代化Linux服务器运维面板,支持一键部署Ollama等AI应用,简化VPS管理流程。
- Stars: ⭐️ 35.0k
- Tags:
Docker服务器管理Ollama - 最后活动时间: 2026-04-17
nacos
阿里巴巴开源的服务发现与配置管理平台,支持MCP注册和AI Agent注册,助力AI云原生应用构建。
- Stars: ⭐️ 32.9k
- Tags:
服务发现MCP注册AI云原生 - 最后活动时间: 2026-04-16
rustfs
高性能AI原生对象存储系统,兼容S3协议,比MinIO快2.3倍,专为AI工作负载设计。
- Stars: ⭐️ 26.1k
- Tags:
AI存储S3兼容高性能 - 最后活动时间: 2026-04-19
airbyte
领先的数据集成平台,支持从API、数据库和文件到数据仓库的ETL/ELT数据管道构建,为AI/ML系统提供可靠的数据基础设施。
- Stars: ⭐️ 21.1k
- Tags:
data-integrationdata-pipelineetleltdata-engineering - 最后活动时间: 2026-04-18
anubis
HTTP 请求分析工具,用于识别和阻止 AI 爬虫,保护网站资源免受滥用。
- Stars: ⭐️ 18.6k
- Tags:
ai-crawlersecuritydefensehttp - 最后活动时间: 2026-04-18
sealos
基于Kubernetes的AI原生云操作系统,支持从云端IDE开发到生产部署的完整应用生命周期管理,非常适合构建和扩展现代AI应用。
- Stars: ⭐️ 17.3k
- Tags:
KubernetesCloud OSAI Infrastructure - 最后活动时间: 2026-04-16
kubesphere
面向Kubernetes多云、数据中心和边缘管理的容器平台,支持LLM工作负载部署与云原生AI基础设施。
- Stars: ⭐️ 16.9k
- Tags:
KubernetesCloud NativeDevOpsLLM - 最后活动时间: 2026-04-14
argo-workflows
Kubernetes原生工作流引擎,专为机器学习流水线和MLOps场景设计,支持DAG编排和GitOps自动化部署。
- Stars: ⭐️ 16.6k
- Tags:
MLOpsKubernetesWorkflow - 最后活动时间: 2026-04-18
apisix
云原生API网关和AI网关,支持流量管理、负载均衡和服务网格,为AI应用提供高性能的流量编排能力。
- Stars: ⭐️ 16.5k
- Tags:
api-gatewayai-gatewaykubernetescloud-native - 最后活动时间: 2026-04-18
dagger
强大的自动化引擎,支持本地、CI和云端运行,可用于构建、测试和部署AI项目工作流。
- Stars: ⭐️ 15.7k
- Tags:
CI/CDAutomationDevOpsAI Agents - 最后活动时间: 2026-04-18
self-hosted-ai-starter-kit
n8n打造的开源自托管AI入门套件,提供完整工具链,帮助快速搭建安全、自主可控的本地AI环境。
- Stars: ⭐️ 14.6k
- Tags:
Self-hostedAI AgentsLow-code - 最后活动时间: 2026-01-06
pyodide
基于WebAssembly的浏览器端Python运行环境,支持在浏览器中运行NumPy、pandas、scikit-learn等科学计算和机器学习库。
- Stars: ⭐️ 14.5k
- Tags:
webassemblypythonbrowsermachine-learning - 最后活动时间: 2026-04-17
sub2api
一站式 AI API 中转服务,统一接入 Claude、OpenAI、Gemini 等订阅,支持拼车共享分摊成本。
- Stars: ⭐️ 13.5k
- Tags:
api-proxyclaudeopenaigeminisubscription - 最后活动时间: 2026-04-18
trino
分布式SQL查询引擎,专为大数据分析设计,支持多种数据源的高性能查询。
- Stars: ⭐️ 12.7k
- Tags:
big-datasqlquery-enginedistributed-systemsdata-lake - 最后活动时间: 2026-04-17
ubicloud
开源的AWS替代方案,提供弹性计算、块存储、K8s、AI推理服务等完整的云基础设施服务。
- Stars: ⭐️ 12.0k
- Tags:
cloudkubernetesai-inferenceopen-source - 最后活动时间: 2026-04-18
kubeshark
Kubernetes集群网络可观测性工具,使用eBPF捕获流量,支持AI代理通过MCP协议访问。
- Stars: ⭐️ 11.9k
- Tags:
kubernetesnetwork-observabilityebpfmcpdevops - 最后活动时间: 2026-04-18
keep
开源的AIOps和告警管理平台,利用AI技术实现智能运维、告警去重、根因分析和自动化工作流编排。
- Stars: ⭐️ 11.7k
- Tags:
AIOpsAlert ManagementDevOpsWorkflow Automation - 最后活动时间: 2026-04-17
OpenMetadata
统一元数据管理平台,支持数据发现与治理,内置MCP服务器可与AI助手无缝集成。
- Stars: ⭐️ 11.2k
- Tags:
MetadataData GovernanceMCP Server - 最后活动时间: 2026-04-18
OpenSandbox
通用AI应用沙箱平台,提供多语言SDK和Docker/K8s运行时,支持Coding Agent、代码执行和RL训练场景。
- Stars: ⭐️ 10.1k
- Tags:
SandboxAI InfrastructureKubernetes - 最后活动时间: 2026-04-18
skypilot
统一AI基础设施管理平台,支持跨云GPU/TPU调度、成本优化和分布式训练推理。
- Stars: ⭐️ 9.9k
- Tags:
GPU ManagementCloud InfrastructureDistributed Training - 最后活动时间: 2026-04-18
moltworker
在Cloudflare Workers无服务器平台上运行OpenClaw AI Agent的轻量级云端部署方案。
- Stars: ⭐️ 9.8k
- Tags:
ServerlessCloudflareAI Agents - 最后活动时间: 2026-04-17
3FS
专为AI训练和推理工作负载设计的高性能分布式文件系统,解决大规模AI计算中的存储挑战。
- Stars: ⭐️ 9.8k
- Tags:
Distributed StorageAI InfrastructureHigh Performance - 最后活动时间: 2026-03-30
risingwave
面向智能体AI的事件流平台,支持实时数据摄取、转换和服务,可大规模运行。
- Stars: ⭐️ 8.9k
- Tags:
event-streamingkafkaruststream-processingai-infrastructure - 最后活动时间: 2026-04-18
delta
开源存储框架,支持构建Lakehouse架构,广泛应用于AI/ML数据管道和大规模数据分析场景。
- Stars: ⭐️ 8.8k
- Tags:
delta-lakebig-dataanalyticsdata-lakehousespark - 最后活动时间: 2026-04-18
mage-ai
现代化的数据管道构建与管理平台,支持ETL/ELT与机器学习数据准备。
- Stars: ⭐️ 8.7k
- Tags:
data-pipelinesetldata-engineeringorchestration - 最后活动时间: 2026-04-02
beam
Apache Beam是统一的批处理和流式数据处理编程模型,广泛用于机器学习数据管道和大规模数据处理。
- Stars: ⭐️ 8.5k
- Tags:
apache-beamdata-processingml-pipelinesstreaming - 最后活动时间: 2026-04-18
docker-stacks
开箱即用的Jupyter Docker镜像集合,为AI/ML开发和数据科学提供完整的容器化开发环境。
- Stars: ⭐️ 8.4k
- Tags:
jupyterdockerpythonmachine-learningdata-science - 最后活动时间: 2026-04-12
jupyterhub
Jupyter笔记本多用户服务器,为团队提供共享的AI/ML开发环境。
- Stars: ⭐️ 8.3k
- Tags:
jupyterjupyterhubmulti-usernotebook - 最后活动时间: 2026-04-15
higress
AI原生API网关,专为AI应用设计的云原生网关解决方案,支持AI流量管理与路由。
- Stars: ⭐️ 8.2k
- Tags:
ai-gatewayapi-gatewaycloud-nativeenvoy - 最后活动时间: 2026-04-18
datahaven
Datahaven 是一个兼容 EVM 的 Substrate 区块链,利用 EigenLayer 安全机制为 AI agents 提供去中心化存储基础设施。
- Stars: ⭐️ 8.0k
- Tags:
blockchainstorageai-agentsprivacy - 最后活动时间: 2026-04-17
coroot
开源APM可观测性工具,集成AI驱动的根因分析能力,结合指标、日志、链路追踪和持续性能分析。
- Stars: ⭐️ 7.6k
- Tags:
APMRoot Cause AnalysisObservabilityeBPF - 最后活动时间: 2026-04-15
hertzbeat
AI驱动的新一代开源实时可观测性系统,支持监控、告警和LLM增强分析。
- Stars: ⭐️ 7.2k
- Tags:
ObservabilityMonitoringLLMAlerting - 最后活动时间: 2026-04-16
feast
开源AI/ML特征存储平台,管理机器学习特征的生命周期,支持实时和批处理特征服务。
- Stars: ⭐️ 7.0k
- Tags:
Feature StoreMLOpsMachine Learning - 最后活动时间: 2026-04-17
flower
友好的联邦学习框架,支持跨设备分布式 AI 模型训练,兼容 PyTorch、TensorFlow 等多种深度学习框架。
- Stars: ⭐️ 6.8k
- Tags:
Federated LearningDistributed TrainingPrivacyFramework - 最后活动时间: 2026-04-16
AIInfra
AI基础设施资源合集,涵盖从底层芯片到软件栈的AI大模型训练与推理系统知识。
- Stars: ⭐️ 6.8k
- Tags:
ai-infrastructureai-systemtraininginference - 最后活动时间: 2025-12-22
Agent Starter Pack
生产级 AI 智能体部署模板,几分钟内部署到 Google Cloud,内置 CI/CD、评估和可观测性。
- Stars: ⭐️ 6.3k
- Tags:
AI AgentsGCPCI/CDObservability - 最后活动时间: 2026-04-17
deepo
一键部署深度学习开发环境,Docker镜像支持主流框架如TensorFlow、PyTorch等。
- Stars: ⭐️ 6.3k
- Tags:
DockerDeep LearningEnvironment - 最后活动时间: 2026-03-25
materialize
面向AI代理的实时数据层,支持SQL创建即时业务视图和流数据处理
- Stars: ⭐️ 6.3k
- Tags:
databasestreamingsqlreal-timedata-stream - 最后活动时间: 2026-04-19
cubefs
云原生分布式存储系统,专为AI场景优化的存储解决方案,支持对象存储和Kubernetes集成。
- Stars: ⭐️ 5.5k
- Tags:
cloud-native-storageai-native-storagekubernetesdistributed-storage - 最后活动时间: 2026-04-13
volcano
CNCF云原生批处理系统,专为AI/ML工作负载设计,支持Kubernetes上的大规模训练和推理任务调度。
- Stars: ⭐️ 5.5k
- Tags:
kubernetesmachine-learningbatch-systemsai-training - 最后活动时间: 2026-04-18
rivet
专为AI智能体和协作应用设计的有状态Actor运行时基础设施。
- Stars: ⭐️ 5.5k
- Tags:
actor-modelai-infrastructurestateful - 最后活动时间: 2026-04-18
tau
面向人类与机器的全栈工作空间平台,支持云原生、分布式系统和AI工作负载。
- Stars: ⭐️ 5.0k
- Tags:
aicloud-nativedistributed-systemsserverlesswebassembly - 最后活动时间: 2026-04-05
cube-studio
开源云原生一站式机器学习平台,支持 MLOps 全流程、大模型微调训练、多机推理部署及国产算力生态。
- Stars: ⭐️ 5.0k
- Tags:
MLOpsKubernetes大模型训练分布式推理 - 最后活动时间: 2026-02-06
Olares
开源个人云平台,帮助用户重新掌控自己的数据。支持本地AI模型部署和智能家居集成,提供完整的私有云解决方案。
- Stars: ⭐️ 4.4k
- Tags:
ai-agentslocal-aiself-hostedhome-cloud - 最后活动时间: 2026-04-18
nvidia-container-toolkit
NVIDIA容器工具包,支持在容器环境中高效利用GPU资源进行AI训练和推理。
- Stars: ⭐️ 4.3k
- Tags:
dockergpucontainernvidia - 最后活动时间: 2026-04-18
pipelines
Kubernetes 原生的机器学习工作流编排平台,提供可视化界面和 SDK,大幅简化 MLOps 实践和 ML 流水线管理。
- Stars: ⭐️ 4.1k
- Tags:
KubeflowMLOpsKubernetesPipeline - 最后活动时间: 2026-04-18
aws-sdk-pandas
AWS官方pandas集成库,轻松连接Athena、Redshift、S3等AWS数据服务,简化云端数据处理。
- Stars: ⭐️ 4.1k
- Tags:
awspandasdata-engineeringetlpython - 最后活动时间: 2026-04-18
deepflow
基于eBPF的零侵入式可观测性平台,支持分布式追踪和性能分析,可监控Kubernetes环境下的LLM应用和GPU工作负载。
- Stars: ⭐️ 4.0k
- Tags:
eBPFObservabilityKubernetesLLM Monitoring - 最后活动时间: 2026-04-17
ChatGPT-Telegram-Workers
轻松部署Telegram ChatGPT机器人,支持Cloudflare Workers、Vercel和Docker多平台无服务器部署。
- Stars: ⭐️ 3.8k
- Tags:
ChatGPTTelegramServerless - 最后活动时间: 2026-04-06
octelium
新一代开源零信任安全访问平台,支持AI/MCP网关、VPN、PaaS等多种部署模式。
- Stars: ⭐️ 3.7k
- Tags:
Zero TrustAI GatewayVPN - 最后活动时间: 2026-04-18
polyaxon
MLOps平台,提供机器学习全生命周期的管理与编排工具,支持Kubernetes部署。
- Stars: ⭐️ 3.7k
- Tags:
MLOpsKubernetesMachine-Learning - 最后活动时间: 2026-04-13
swarmpit
轻量级 Docker Swarm 管理平台,支持 AI 友好部署和 MCP 协议集成,提供移动端适配的 PWA 界面。
- Stars: ⭐️ 3.4k
- Tags:
dockerdocker-swarmmcpcontainer-management - 最后活动时间: 2026-04-18
dagu
本地优先的工作流引擎,支持声明式、基于文件的配置,可从单机扩展到分布式集群,适用于AI工作流编排。
- Stars: ⭐️ 3.3k
- Tags:
workflow-enginedagjob-schedulerai-workflow - 最后活动时间: 2026-04-18
pinme
一键部署前端应用工具,支持Claude Code Skills集成,零配置静态站点托管。
- Stars: ⭐️ 3.2k
- Tags:
deploymentfrontendclaude-code-skillserverlesshosting - 最后活动时间: 2026-04-15
spark-operator
undefined
- Stars: ⭐️ 3.1k
- Tags:
apache-sparkkuberneteskubernetes-operatormachine-learning - 最后活动时间: 2026-04-16
heavydb
GPU加速的SQL数据库,支持实时分析和机器学习工作负载。
- Stars: ⭐️ 3.1k
- Tags:
cudagpu-databasesqlanalyticsmachine-learning - 最后活动时间: 2026-01-06
robusta
Kubernetes智能告警平台,提供AI增强的告警分组、自动修复和故障诊断能力。
- Stars: ⭐️ 3.0k
- Tags:
KubernetesPrometheusAIOpsMonitoring - 最后活动时间: 2026-04-16
gravitino
强大的开源数据目录系统,支持构建高性能、地理分布式的联邦元数据湖和AI模型目录管理。
- Stars: ⭐️ 2.9k
- Tags:
Data CatalogLakehouseMetadataAI Catalog - 最后活动时间: 2026-04-17
harbor
一键部署完整LLM技术栈,集成数百个AI服务,支持Docker容器化本地自托管。
- Stars: ⭐️ 2.8k
- Tags:
DockerLLMSelf-hosted - 最后活动时间: 2026-04-16
docker-python
Kaggle官方Python Docker镜像,预装常用机器学习与数据科学库。
- Stars: ⭐️ 2.7k
- Tags:
dockerkaggleml-environmentdata-science - 最后活动时间: 2026-03-20
chdb
基于ClickHouse的进程内OLAP SQL引擎,支持高性能数据分析。
- Stars: ⭐️ 2.7k
- Tags:
clickhouseolapsqldata-science - 最后活动时间: 2026-04-01
gpu-operator
NVIDIA官方Kubernetes GPU运算符,自动化管理集群中的GPU资源配置与调度。
- Stars: ⭐️ 2.6k
- Tags:
kubernetesgpunvidiacuda - 最后活动时间: 2026-04-18
amazon-bedrock-agentcore-samples
帮助开发者将AI智能体快速部署到生产环境,提供企业级扩展性、可靠性和安全性支持。
- Stars: ⭐️ 2.6k
- Tags:
AI AgentsProduction DeploymentAWS Bedrock - 最后活动时间: 2026-04-17
kite
轻量级Kubernetes仪表板,整合多集群管理、企业级用户治理和AI智能体于一体的平台级解决方案。
- Stars: ⭐️ 2.5k
- Tags:
kubernetesai-agentdashboardmulti-cluster - 最后活动时间: 2026-04-16
kuberay
在Kubernetes上运行Ray应用的工具包,支持分布式机器学习与深度学习工作负载。
- Stars: ⭐️ 2.4k
- Tags:
kubernetesraydeep-learningmachine-learning - 最后活动时间: 2026-04-17
hivemind
PyTorch 去中心化深度学习框架,支持全球志愿者协同训练模型。
- Stars: ⭐️ 2.4k
- Tags:
distributed-trainingdecentralizedpytorch - 最后活动时间: 2026-01-11
awesome-argo
Argo生态系统精选资源列表,涵盖Argo Workflows、ArgoCD等云原生工具,支持MLOps和机器学习工作流编排。
- Stars: ⭐️ 2.4k
- Tags:
argoargocdkubernetesmlopsgitopsworkflow-orchestration - 最后活动时间: 2026-02-28
boinc
开源分布式计算平台,支持志愿计算和网格计算,可用于AI模型训练和科学计算任务的大规模分布式处理。
- Stars: ⭐️ 2.4k
- Tags:
distributed-computingvolunteer-computinggrid-computinghigh-performance-computing - 最后活动时间: 2026-04-19
1backend
企业级微服务平台,支持快速构建和部署 AI 应用,提供私有化部署能力。
- Stars: ⭐️ 2.3k
- Tags:
ai-platformmicroservicesbackendself-hosted - 最后活动时间: 2026-04-18
sedona
大规模地理空间数据处理集群计算框架,支持空间SQL查询和分析,适用于AI地理空间应用的数据预处理管道。
- Stars: ⭐️ 2.3k
- Tags:
geospatialcluster-computingspatial-analysisspatial-query - 最后活动时间: 2026-04-18
sagemaker-python-sdk
AWS SageMaker官方Python SDK,支持在云端训练和部署机器学习模型。
- Stars: ⭐️ 2.2k
- Tags:
awssagemakermodel-deployment - 最后活动时间: 2026-04-17
proton
高性能单二进制SQL ETL管道,专为流处理、可观测性分析和AI/ML数据管道设计。
- Stars: ⭐️ 2.2k
- Tags:
etlstream-processingsqlreal-timedata-pipeline - 最后活动时间: 2026-04-17
fugue
分布式计算统一接口,支持在Spark、Dask和Ray上无缝执行SQL、Python、Pandas和Polars代码,无需重写。
- Stars: ⭐️ 2.2k
- Tags:
distributed-computingsparkdaskraymachine-learning - 最后活动时间: 2026-04-14
cloudflare-ai-web
Cloudflare AI平台一键部署方案,快速搭建AI应用服务。
- Stars: ⭐️ 2.2k
- Tags:
cloudflareai-deploymentserverlessworkers-ainextjs - 最后活动时间: 2026-04-11
cube-studio
开源云原生一站式机器学习平台,支持大模型训练推理、MLOps全流程、多机分布式训练及国产算力调度。
- Stars: ⭐️ 2.1k
- Tags:
mlopsmachine-learning-platformkubernetesllm-training - 最后活动时间: 2026-04-13
fusio
面向开发者的自托管 API 管理平台,支持 MCP 服务器和 AI Agent 集成。
- Stars: ⭐️ 2.1k
- Tags:
api-gatewayapi-managementmcp-serverself-hosted - 最后活动时间: 2026-04-18
TileDB
通用存储引擎,支持密集和稀疏数组数据,适用于科学计算和AI数据管理。
- Stars: ⭐️ 2.0k
- Tags:
storage-enginearraysdata-sciencescientific-computingdatabase - 最后活动时间: 2026-03-30
nono
内核级AI智能体沙箱安全工具,提供能力隔离、安全密钥管理和不可变审计链,防范提示注入等安全威胁。
- Stars: ⭐️ 2.0k
- Tags:
Agent SecuritySandboxZero-Trust - 最后活动时间: 2026-04-18
SREWorks
云原生数智运维平台,集成AIOps与DataOps能力,提供智能运维解决方案。
- Stars: ⭐️ 2.0k
- Tags:
aiopskubernetesdevopscloudnativesre - 最后活动时间: 2025-12-13
fluid
CNCF项目,为云原生大数据/AI应用提供数据抽象与加速,支持Kubernetes环境下的分布式缓存。
- Stars: ⭐️ 1.9k
- Tags:
kubernetesdata-abstractiondistributed-cachecncfai-infrastructure - 最后活动时间: 2026-04-17
openmeter
专为 AI 和 API 设计的实时用量计量与计费平台,支持百万级事件的实时聚合与基于用量的计费。
- Stars: ⭐️ 1.9k
- Tags:
meteringbillingai-usageusage-based-billing - 最后活动时间: 2026-04-18
kubewall
单二进制 Kubernetes 仪表板,支持多集群管理与 AI 集成,为 Kubernetes 运维提供智能辅助。
- Stars: ⭐️ 1.9k
- Tags:
KubernetesAIDashboard - 最后活动时间: 2026-04-16
awesome-spark
Apache Spark资源精选列表,包含MLlib机器学习库,是大规模数据处理和机器学习管道的重要基础设施。
- Stars: ⭐️ 1.9k
- Tags:
apache-sparkpysparkmachine-learningbig-data - 最后活动时间: 2026-02-27
aistore
专为AI应用设计的可扩展分布式存储系统,支持Kubernetes部署和ML训练工作负载,提供高性能对象存储和ETL卸载能力。
- Stars: ⭐️ 1.8k
- Tags:
AI StorageKubernetesDistributed - 最后活动时间: 2026-04-18
Bytez
全球最大无服务器模型推理API平台,提供220,000+AI模型统一访问接口,一键调用主流大模型。
- Stars: ⭐️ 1.8k
- Tags:
API平台无服务器模型推理 - 最后活动时间: 2026-03-03
plik
轻量级临时文件上传系统,支持端到端加密,可自托管,已集成MCP协议支持AI助手直接操作文件。
- Stars: ⭐️ 1.7k
- Tags:
file-sharingself-hostedmcpe2ee - 最后活动时间: 2026-04-16
zero-to-jupyterhub-k8s
在Kubernetes上部署JupyterHub的官方Helm Chart,为AI/ML开发提供云端笔记本环境。
- Stars: ⭐️ 1.7k
- Tags:
jupyterhubkubernetesdata-science - 最后活动时间: 2026-04-16
koordinator
基于QoS的Kubernetes调度系统,为微服务、大数据和AI作业提供最优的资源分配和调度策略。
- Stars: ⭐️ 1.7k
- Tags:
kubernetesschedulingAI-workloadsresource-management - 最后活动时间: 2026-04-16
distributed
Dask分布式任务调度器,为大规模机器学习和数据处理提供强大的分布式计算能力。
- Stars: ⭐️ 1.7k
- Tags:
distributed-computingdaskpydatapython - 最后活动时间: 2026-04-18
agent-safehouse
为本地AI代理提供沙箱安全隔离环境,限制其仅能读写必要的文件和资源,保护系统安全。
- Stars: ⭐️ 1.6k
- Tags:
AI代理沙箱安全安全隔离 - 最后活动时间: 2026-04-05
terraform-skill
Claude Agent 的 Terraform 和 OpenTofu 技能扩展,支持测试、模块管理和生产级最佳实践。
- Stars: ⭐️ 1.6k
- Tags:
ClaudeTerraformInfrastructureDevOps - 最后活动时间: 2026-02-02
robustmq
下一代统一通信基础设施,专为AI、物联网和大数据场景设计的高性能消息队列系统,支持MQTT、AMQP等多种协议。
- Stars: ⭐️ 1.6k
- Tags:
消息队列MQTTRustAI基础设施 - 最后活动时间: 2026-04-18
quix-streams
基于Kafka的Python流式DataFrame库,适用于实时机器学习数据处理管道。
- Stars: ⭐️ 1.5k
- Tags:
kafkastream-processingpythonreal-time-data - 最后活动时间: 2026-04-10
hash
开源多租户平台,支持自建知识图谱与仿真模拟。
- Stars: ⭐️ 1.5k
- Tags:
knowledge-graphsimulationrustmulti-tenant - 最后活动时间: 2026-04-18
comfyui-deploy
开源的ComfyUI部署平台,类似Vercel的一键部署体验,专为AI图像生成工作流设计。
- Stars: ⭐️ 1.5k
- Tags:
ComfyUIDeploymentAI-Infrastructure - 最后活动时间: 2025-11-13
app-platform
大模型应用工程平台,集成声明式编程和低代码配置工具。
- Stars: ⭐️ 1.4k
- Tags:
aiagentagentic-aijavalow-code - 最后活动时间: 2026-04-16
bittensor
去中心化AI网络协议,结合区块链技术实现互联网规模的神经网络协作训练与推理。
- Stars: ⭐️ 1.4k
- Tags:
decentralized-aiblockchainp2p - 最后活动时间: 2026-04-17
gloo
PyTorch官方的分布式训练集合通信库,支持多机多卡训练。
- Stars: ⭐️ 1.4k
- Tags:
distributed-trainingcollectivespytorchmulti-machine - 最后活动时间: 2026-03-20
oracle-db-examples
Oracle AI 数据库代码示例集合,展示如何在 Oracle 数据库中使用 AI 功能,包括向量存储、机器学习等特性。
- Stars: ⭐️ 1.4k
- Tags:
oracleai-databasevector-databasemachine-learning - 最后活动时间: 2026-04-13
aws-genai-llm-chatbot
AWS上的多LLM多RAG聊天机器人部署方案,支持Amazon Bedrock、OpenAI、Anthropic等多种模型,模块化架构易于扩展。
- Stars: ⭐️ 1.4k
- Tags:
AWSLLMRAGChatbotCDK - 最后活动时间: 2026-03-06
AI-Horde
众包分布式AI计算集群,支持AI图像和文本生成的志愿者计算网络。
- Stars: ⭐️ 1.4k
- Tags:
distributed-computingstable-diffusiongptvolunteer-computing - 最后活动时间: 2026-04-18
ChatGPT-Mirror
一键部署个人ChatGPT镜像站,支持快速搭建和自定义配置,方便区域访问受限用户。
- Stars: ⭐️ 1.3k
- Tags:
chatgptmirrordeploymentproxy - 最后活动时间: 2026-03-10
terraform-mcp-server
Terraform MCP服务器,为AI智能体提供与Terraform生态系统的无缝集成,支持基础设施即代码开发自动化。
- Stars: ⭐️ 1.3k
- Tags:
mcpterraforminfrastructure-as-codeai-agents - 最后活动时间: 2026-04-17
generative-ai-use-cases
AWS官方生成式AI业务用例实现方案,涵盖Claude、Llama等模型和RAG技术,帮助企业安全部署AI应用。
- Stars: ⭐️ 1.3k
- Tags:
AWSGenerative AILLMRAG - 最后活动时间: 2026-04-18
kusion
声明式意图驱动的内部开发者平台编排器,支持LLMOps和多云部署的现代化基础设施解决方案。
- Stars: ⭐️ 1.3k
- Tags:
platform-engineeringkubernetesllmopscloud-native - 最后活动时间: 2026-01-04
arkflow
高性能Rust流处理引擎,无缝集成AI能力,支持实时数据处理和智能分析。适用于机器学习数据管道和实时AI推理场景。
- Stars: ⭐️ 1.3k
- Tags:
RustStream ProcessingAIReal-time - 最后活动时间: 2026-04-14
aipexbase
AI 原生后端即服务平台,专注前端开发,后端由 AI 自动处理。
- Stars: ⭐️ 1.3k
- Tags:
baasai-nativebackendcloud-platform - 最后活动时间: 2026-04-17
KAI-Scheduler
开源的 Kubernetes 原生调度器,专为大规模 AI 工作负载设计,支持 GPU 资源优化和分布式训练任务调度。
- Stars: ⭐️ 1.2k
- Tags:
kubernetesai-schedulergpu-schedulingmachine-learning - 最后活动时间: 2026-04-18
grafbase
Grafbase GraphQL联邦网关,支持MCP协议,为AI应用提供高性能的GraphQL数据联邦能力。
- Stars: ⭐️ 1.2k
- Tags:
graphqlfederationmcprust - 最后活动时间: 2026-04-17
xorbits
可扩展的Python数据科学与机器学习框架,API兼容且高性能。
- Stars: ⭐️ 1.2k
- Tags:
scalabledistributed-systemsmachine-learningpandasnumpy - 最后活动时间: 2026-02-14
modal-examples
Modal云平台的示例代码集合,展示无服务器GPU计算和ML部署。
- Stars: ⭐️ 1.2k
- Tags:
modalserverlessgpucloudpytorch - 最后活动时间: 2026-04-17
deep-learning-containers
AWS官方深度学习容器,一站式AI/ML云端部署解决方案。
- Stars: ⭐️ 1.2k
- Tags:
awsdeep-learningcontainersdeployment - 最后活动时间: 2026-04-19
wuying-agentbay-sdk
专为AI智能体打造的云端沙箱环境SDK,提供安全隔离的运行环境用于AI代理测试和部署。
- Stars: ⭐️ 1.1k
- Tags:
sandboxai-agentscloudsdk - 最后活动时间: 2026-04-16
targets
R语言函数式声明式工作流管道工具,类似Makefile,支持高性能计算和可重复研究。
- Stars: ⭐️ 1.1k
- Tags:
pipelineworkflowrreproducibilitydata-science - 最后活动时间: 2026-02-23
E2B Infra
E2B云平台底层基础设施,为AI智能体提供安全的代码执行沙箱环境。
- Stars: ⭐️ 1.0k
- Tags:
SandboxCloudMicroVM - 最后活动时间: 2026-04-19
manifests
Kubeflow AI参考平台的部署清单,支持企业级多租户和安全配置,简化机器学习平台在Kubernetes上的部署。
- Stars: ⭐️ 1.0k
- Tags:
kubeflowkubernetesdeploymentmlops - 最后活动时间: 2026-04-11
sandbox-sdk
基于Cloudflare边缘网络的沙盒代码执行环境,为AI智能体提供安全隔离的代码解释器。
- Stars: ⭐️ 986
- Tags:
sandboxcode-interpreteredge-computingcontainers - 最后活动时间: 2026-04-17
gondolin
基于Linux microvm的实验性AI智能体沙箱环境,使用TypeScript控制平面。
- Stars: ⭐️ 930
- Tags:
sandboxmicrovmagent-security - 最后活动时间: 2026-04-12
kaito
Kubernetes AI工具链操作器,简化AI模型在Kubernetes集群上的部署和管理,支持GPU资源调度。
- Stars: ⭐️ 919
- Tags:
kubernetesaigpuoperatormlops - 最后活动时间: 2026-04-18
hera
Python原生集成库,让Python代码轻松编排到Argo Workflows上运行,支持纯Python构建和提交工作流。
- Stars: ⭐️ 895
- Tags:
Argo WorkflowsPythonKubernetesMLOps - 最后活动时间: 2026-04-14
kubectl-mcp-server
Kubernetes MCP服务器,让AI助手能够管理和操作K8s集群。
- Stars: ⭐️ 869
- Tags:
kubernetesmcpmcp-serverdevops - 最后活动时间: 2026-04-08
vibe
macOS上的轻量级Linux虚拟机工具,用于安全沙箱化运行LLM智能体。
- Stars: ⭐️ 866
- Tags:
SandboxLLM AgentsVirtualization - 最后活动时间: 2026-03-28
covalent
Python工作流编排工具,支持机器学习、高性能计算和量子计算任务的异构环境调度。
- Stars: ⭐️ 860
- Tags:
workfloworchestrationmachine-learningquantum-computing - 最后活动时间: 2026-04-14
bacalhau
分布式计算框架,支持AI数据管道、批处理和去中心化计算任务的高效执行平台。
- Stars: ⭐️ 855
- Tags:
distributed-computingai-pipelinedata-processing - 最后活动时间: 2026-04-19
data-on-eks
在Amazon EKS上构建、部署和扩展数据与ML平台的工具集,支持Kubeflow、Ray、Spark等框架。
- Stars: ⭐️ 835
- Tags:
kuberneteseksmlflowkubeflow - 最后活动时间: 2026-04-16
flake
Nix Flake配置集合,为众多AI项目提供便捷的包管理和开发环境。
- Stars: ⭐️ 825
- Tags:
nixnixosaiflakedev-environment - 最后活动时间: 2026-04-18
n8n-install
一键部署自托管AI自动化平台,集成n8n、Ollama、Flowise、RAG等30+工具。
- Stars: ⭐️ 817
- Tags:
Self-hostedDockerOllamaRAG - 最后活动时间: 2026-03-28
groundx-on-prem
可Kubernetes部署的文档解析、存储和搜索服务,支持本地化部署。
- Stars: ⭐️ 813
- Tags:
Kubernetes文档解析本地部署 - 最后活动时间: 2026-03-18
onyxia
Kubernetes 原生的数据科学开发环境,为 AI/ML 工作负载提供完整的容器化开发平台。
- Stars: ⭐️ 813
- Tags:
kubernetesdata-sciencedatalabhelm - 最后活动时间: 2026-04-11
arena
Kubeflow命令行工具,简化Kubernetes上的机器学习任务管理,支持一键部署训练任务和模型服务。
- Stars: ⭐️ 810
- Tags:
KubeflowKubernetes深度学习 - 最后活动时间: 2026-04-16
k8m
轻量级跨平台 Kubernetes AI 管理面板,集成大模型、智能体和MCP支持,提供多集群管理、智能分析和实时异常检测功能。
- Stars: ⭐️ 807
- Tags:
aikubernetesdashboardmcpllmchatgpt - 最后活动时间: 2026-04-10
k7
轻量级虚拟机沙箱基础设施,用于安全执行不可信代码,支持CLI、API和Python SDK,是AI智能体代码执行的安全底座。
- Stars: ⭐️ 776
- Tags:
sandboxagentssecurityvirtual-machine - 最后活动时间: 2025-12-14
kernel-images
面向自动化和Web智能体的浏览器即服务基础设施。
- Stars: ⭐️ 751
- Tags:
browser-automationinfrastructuredockerunikernel - 最后活动时间: 2026-04-16
oio-sds
高性能软件定义对象存储系统,支持 S3 和 Swift 协议,专为大数据和 AI 工作负载设计。
- Stars: ⭐️ 751
- Tags:
object-storages3storagebig-data - 最后活动时间: 2026-04-17
gcloud-mcp
Google Cloud MCP 服务器,让 AI 智能体能够与 Google Cloud 服务进行交互操作。
- Stars: ⭐️ 741
- Tags:
gcloudmcpgoogle-cloudai-integration - 最后活动时间: 2026-04-17
heir
基于MLIR的同态加密编译器,支持在加密数据上直接进行计算,为隐私保护的AI推理提供基础设施支持。
- Stars: ⭐️ 710
- Tags:
Homomorphic EncryptionMLIRPrivacy-Preserving AI - 最后活动时间: 2026-04-19
vertex-ai-samples
Google Cloud Vertex AI官方示例代码库,包含Jupyter notebooks和代码示例,全面演示机器学习和生成式AI工作流开发。
- Stars: ⭐️ 704
- Tags:
vertex-aigeminigenerative-aimlops - 最后活动时间: 2026-04-18
BharatMLStack
开源端到端机器学习基础设施栈,支持实时和批量ML工作负载的大规模部署。
- Stars: ⭐️ 690
- Tags:
ml-infrastructurefeature-storemlopsmachine-learning - 最后活动时间: 2026-04-18
vertex-ai-mlops
Google Cloud Vertex AI 端到端 MLOps 工作流模板,涵盖机器学习模型训练、部署和运维全流程。
- Stars: ⭐️ 689
- Tags:
MLOpsVertex AIGCPDeep Learning - 最后活动时间: 2026-04-18
worker-comfyui
将ComfyUI部署为RunPod无服务器API,支持SDXL和Stable Diffusion工作流的云端托管与弹性扩展。
- Stars: ⭐️ 676
- Tags:
ComfyUIServerlessStable Diffusion - 最后活动时间: 2026-03-24
mlops-stacks
Databricks ML 项目启动模板,开箱即用的生产级最佳实践配置。
- Stars: ⭐️ 669
- Tags:
databricksmlopsmachine-learning - 最后活动时间: 2026-01-28
enterprise_gateway
轻量级多租户Jupyter网关,支持在Kubernetes、Spark等分布式集群上运行Notebook内核,适用于AI/ML分布式计算场景。
- Stars: ⭐️ 662
- Tags:
jupyterkubernetesdistributed-computingsparkenterprise-gateway - 最后活动时间: 2026-03-06
turbodbc
高性能Python ODBC数据库连接模块,支持NumPy和大数据场景下的快速数据访问。
- Stars: ⭐️ 656
- Tags:
odbcdatabasenumpypythondata-science - 最后活动时间: 2026-04-13
azure-skills
微软官方Azure代理插件,提供Azure场景的技能和MCP服务器配置。
- Stars: ⭐️ 646
- Tags:
azuremcpagent-skillscloud - 最后活动时间: 2026-04-17
curvine
基于 Rust 构建的高性能分布式多层缓存系统,专为 AI 基础设施优化。
- Stars: ⭐️ 641
- Tags:
ai-infrastructurecacherustdistributed-systems - 最后活动时间: 2026-04-17
vibe
MacOS上的轻量级Linux虚拟机,专为LLM Agent沙箱隔离设计,保障安全运行环境。
- Stars: ⭐️ 640
- Tags:
SandboxVMAgent Security - 最后活动时间: 2026-04-16
vibe
MacOS上的轻量级Linux虚拟机,专为LLM Agent沙箱隔离设计,保障安全运行环境。
- Stars: ⭐️ 640
- Tags:
SandboxVMAgent Security - 最后活动时间: 2026-04-16
dify-helm
Dify平台的Kubernetes Helm部署方案,支持在K8s集群中快速部署LLM应用。
- Stars: ⭐️ 629
- Tags:
KubernetesHelmDify部署 - 最后活动时间: 2026-04-02
mlops-v2
Azure MLOps 企业级解决方案加速器,提供生产就绪的机器学习模型部署模板。
- Stars: ⭐️ 625
- Tags:
azuremlopsmachine-learningdevops - 最后活动时间: 2025-12-08
deep-learning-frameworks
为ArcGIS系统提供深度学习框架的安装支持与环境配置工具。
- Stars: ⭐️ 611
- Tags:
Deep LearningArcGISInfrastructureInstallation - 最后活动时间: 2025-11-21
kubespawner
JupyterHub的Kubernetes动态Pod生成器,支持为每个用户创建独立的Jupyter Notebook环境,广泛用于数据科学和机器学习工作流。
- Stars: ⭐️ 600
- Tags:
jupyterjupyterhubkubernetesdata-science - 最后活动时间: 2026-04-06
venice
LinkedIn开源的衍生数据平台,专为行星级规模工作负载设计,支持AI/ML数据处理与推理场景。
- Stars: ⭐️ 599
- Tags:
ML PlatformData InfrastructureScalable - 最后活动时间: 2026-04-18
self-host-n8n-on-gcr
在 Google Cloud 上自托管 n8n 的解决方案,支持 AI Agent 工作流的低成本无服务器部署。
- Stars: ⭐️ 595
- Tags:
n8nSelf-hostingGoogle CloudAI Agents - 最后活动时间: 2026-04-01
cloud-run-mcp
MCP 服务器,支持将 AI 应用一键部署到 Google Cloud Run,简化云端部署流程。
- Stars: ⭐️ 592
- Tags:
mcpmcp-servergoogle-cloudcloud-run - 最后活动时间: 2026-04-17
redun
支持AWS/GCP的数据科学工作流引擎,提供任务调度与Docker容器编排能力。
- Stars: ⭐️ 581
- Tags:
workflow-enginedata-engineeringetlml - 最后活动时间: 2026-04-16
arc
高性能分析型数据库,基于 DuckDB SQL 引擎和 Parquet 存储,支持 AI、IoT、日志分析等场景,单二进制部署无厂商锁定。
- Stars: ⭐️ 575
- Tags:
DuckDBParquetOLAPAnalytics - 最后活动时间: 2026-04-16
ollama-helm
用于在Kubernetes集群中部署Ollama的Helm Chart,支持GPU资源配置和模型管理,适合生产环境。
- Stars: ⭐️ 567
- Tags:
HelmKubernetesLLM部署 - 最后活动时间: 2026-04-18
Slurm-web
Slurm HPC 和 AI 集群的开源 Web 管理界面,提供可视化监控和管理功能。
- Stars: ⭐️ 556
- Tags:
slurmhpccluster-managementwebui - 最后活动时间: 2026-04-16
matchlock
基于Linux沙箱的AI代理工作负载安全隔离方案,保障AI系统运行环境的安全性。
- Stars: ⭐️ 555
- Tags:
securitysandboxai-agentslinux - 最后活动时间: 2026-04-08
databricks-sdk-py
Databricks官方Python SDK,用于在Databricks数据智能平台上构建AI和机器学习应用。
- Stars: ⭐️ 542
- Tags:
databrickssdkpythonmachine-learning - 最后活动时间: 2026-04-17
sagemaker-training-toolkit
AWS SageMaker官方训练工具包,支持在Docker容器中训练机器学习模型。
- Stars: ⭐️ 535
- Tags:
awssagemakermachine-learningtrainingdocker - 最后活动时间: 2026-01-16
codalab-competitions
机器学习竞赛平台,支持基准测试和科学研究竞赛。
- Stars: ⭐️ 534
- Tags:
ml-competitionsbenchmarksmachine-learning-platform - 最后活动时间: 2026-04-14
generative-ai-cdk-constructs
AWS官方提供的生成式AI CDK构造库,包含RAG、Agent、知识库等常见GenAI架构模式的示例实现。
- Stars: ⭐️ 532
- Tags:
AWSCDKGenAIRAG - 最后活动时间: 2026-04-17
cloud-code
在Cloudflare上运行OpenCode,构建专属云端AI代理的轻量级解决方案。
- Stars: ⭐️ 530
- Tags:
cloudflareopencodecloud-agentserverless - 最后活动时间: 2026-01-29
leash
StrongDM推出的AI代理安全沙盒工具,为AI代理提供安全的容器化运行环境。
- Stars: ⭐️ 529
- Tags:
ai-agentssandboxsecuritycontainer - 最后活动时间: 2026-04-06
unbody
AI 时代的模块化后端平台,专为构建知识驱动的 AI 原生应用设计。
- Stars: ⭐️ 525
- Tags:
ai-backendknowledge-basevector-databaserag - 最后活动时间: 2026-04-14
mpi-operator
Kubernetes上运行MPI分布式训练应用的Operator,支持PyTorch和TensorFlow。
- Stars: ⭐️ 524
- Tags:
kubernetesdistributed-trainingmpikubeflow - 最后活动时间: 2026-04-14
examples
Cerebrium无服务器GPU平台示例代码,涵盖LLM、ML模型部署实践。
- Stars: ⭐️ 523
- Tags:
serverless-gpullm-deploymentmlopsai-inference - 最后活动时间: 2026-03-19
ml-on-gcp
Google Cloud平台上的机器学习示例集合,涵盖ML工作流的完整实践指南。
- Stars: ⭐️ 514
- Tags:
GCPMachine LearningCloud - 最后活动时间: 2026-03-27
caddy-defender
Caddy 服务器模块,用于阻止或干扰 AI 爬虫对网站内容的抓取训练,保护原创内容安全。
- Stars: ⭐️ 513
- Tags:
caddyai-blockersecurityweb-security - 最后活动时间: 2026-04-19
Hardware Acceleration
ColossalAI
大规模并行训练框架,让大模型训练更便宜、更快速。支持多种并行策略和异构训练,显著降低开发门槛。
- Stars: ⭐️ 41.4k
- Tags:
Distributed TrainingLLMDeep Learning - 最后活动时间: 2026-04-13
jax
Google开源的高性能机器学习框架,支持自动微分、向量化、JIT编译到GPU/TPU,是构建深度学习模型的核心基础设施。
- Stars: ⭐️ 35.4k
- Tags:
jaxmachine-learningdeep-learninggpuautodiff - 最后活动时间: 2026-04-18
taichi
高性能GPU编程语言,支持可微分编程,适用于AI计算加速与图形学应用。
- Stars: ⭐️ 28.2k
- Tags:
gpu-programmingdifferentiable-programminghigh-performance - 最后活动时间: 2026-04-06
modular
Modular平台包含MAX和Mojo编程语言,为AI开发提供高性能基础设施和统一的执行环境。
- Stars: ⭐️ 25.9k
- Tags:
mojoai-infrastructureprogramming-languagemachine-learningmax - 最后活动时间: 2026-04-18
mlx
Apple官方推出的数组计算框架,专为Apple Silicon芯片优化的机器学习基础设施。
- Stars: ⭐️ 25.5k
- Tags:
Apple SiliconML FrameworkHardware Acceleration - 最后活动时间: 2026-04-18
llmfit
一键检测硬件兼容性,从数百个模型中找到适合本地运行的模型。
- Stars: ⭐️ 23.9k
- Tags:
硬件适配模型选择本地AI - 最后活动时间: 2026-04-18
ncnn
专为移动端优化的高性能神经网络推理框架,支持Android、iOS及多种硬件架构。
- Stars: ⭐️ 23.1k
- Tags:
InferenceMobile AIEdge Computing - 最后活动时间: 2026-04-17
onnxruntime
微软开源的高性能ML推理和训练加速器,跨平台支持,兼容PyTorch、TensorFlow等主流框架。
- Stars: ⭐️ 19.9k
- Tags:
ONNXInferenceCross-platformAcceleration - 最后活动时间: 2026-04-18
ktransformers
一个灵活的异构LLM推理与微调优化框架,支持多种硬件加速方案,帮助开发者在不同设备上高效运行大模型。
- Stars: ⭐️ 17.0k
- Tags:
LLMInferenceHardware OptimizationFine-tuning - 最后活动时间: 2026-04-18
codon
高性能零开销Python编译器,内置NumPy支持,可加速AI/ML工作负载。
- Stars: ⭐️ 16.7k
- Tags:
compilerpythonnumpyhigh-performancegpu-programming - 最后活动时间: 2026-04-11
airllm
在单张4GB GPU上运行70B大语言模型的推理优化方案,突破显存限制。
- Stars: ⭐️ 16.5k
- Tags:
LLM InferenceGPU OptimizationModel Serving - 最后活动时间: 2026-03-10
MNN
阿里巴巴开源的高性能轻量级推理引擎,支持端侧LLM与边缘AI。
- Stars: ⭐️ 15.0k
- Tags:
InferenceEdge AIEmbedded - 最后活动时间: 2026-04-17
ggml
专为边缘设备优化的张量计算库,支持在CPU和Apple Silicon上高效运行大语言模型,是llama.cpp等项目的核心依赖。
- Stars: ⭐️ 14.5k
- Tags:
Tensor LibraryEdge AILLM Inference - 最后活动时间: 2026-04-14
ZLUDA
在非NVIDIA GPU上运行CUDA程序的项目,让AMD等显卡也能执行CUDA加速的AI训练和推理任务。
- Stars: ⭐️ 14.1k
- Tags:
cudagpurusthardware-acceleration - 最后活动时间: 2026-04-19
dask
灵活的并行计算库,为NumPy、Pandas和scikit-learn提供大规模数据处理能力,是机器学习工作流的重要基础设施。
- Stars: ⭐️ 13.8k
- Tags:
parallel-computingnumpypandasscikit-learn - 最后活动时间: 2026-04-13
TensorRT-LLM
NVIDIA官方LLM推理优化库,支持在GPU上高效运行大语言模型,包含先进的优化技术。
- Stars: ⭐️ 13.4k
- Tags:
LLMInferenceNVIDIAGPU - 最后活动时间: 2026-04-18
TensorRT
NVIDIA官方高性能深度学习推理SDK,专为GPU加速优化,支持模型部署与推理加速。
- Stars: ⭐️ 12.9k
- Tags:
Deep LearningInferenceGPUNVIDIA - 最后活动时间: 2026-04-13
FlashMLA
高效的多头潜在注意力内核,优化LLM推理性能的关键组件。
- Stars: ⭐️ 12.6k
- Tags:
attentionllmoptimizationkernels - 最后活动时间: 2026-04-07
numba
基于LLVM的Python动态编译器,支持CUDA GPU加速,让Python代码获得接近C的性能。
- Stars: ⭐️ 11.0k
- Tags:
cudagpucompilerpythonllvmnumpy - 最后活动时间: 2026-04-18
cupy
GPU加速的NumPy与SciPy替代库,为AI/ML计算提供高性能CUDA加速支持。
- Stars: ⭐️ 10.9k
- Tags:
gpucudanumpyscipydeep-learning - 最后活动时间: 2026-04-18
nvtop
类似 htop 的 GPU 进程监控工具,支持 NVIDIA、AMD、Intel、Apple 等多厂商 GPU。AI 从业者必备的系统监控利器,实时查看显存和计算资源占用。
- Stars: ⭐️ 10.5k
- Tags:
gpumonitoringnvidiaamdterminal - 最后活动时间: 2026-02-08
xformers
Meta开源的可扩展Transformer优化库,提供高效内存优化的注意力机制实现,显著提升大模型训练和推理效率。
- Stars: ⭐️ 10.4k
- Tags:
transformersoptimizationmemory-efficientattention - 最后活动时间: 2026-04-17
LeetCUDA
现代CUDA学习笔记,包含200+ CUDA内核、Tensor Cores与Flash Attention实现。
- Stars: ⭐️ 10.3k
- Tags:
cudagpuflash-attention - 最后活动时间: 2026-04-18
accelerate
Hugging Face 出品的 PyTorch 加速库,支持多设备训练、分布式配置、混合精度训练和 FSDP/DeepSpeed,让模型训练更简单高效。
- Stars: ⭐️ 9.6k
- Tags:
PyTorchDistributed TrainingMixed Precision - 最后活动时间: 2026-04-17
cudf
NVIDIA RAPIDS生态的GPU DataFrame库,提供类似Pandas的API,实现大规模数据的GPU加速处理。
- Stars: ⭐️ 9.6k
- Tags:
GPU加速DataFrameRAPIDS - 最后活动时间: 2026-04-18
cutlass
NVIDIA开源的高性能CUDA模板库,专为深度学习线性代数运算优化,支持Tensor Core加速。
- Stars: ⭐️ 9.6k
- Tags:
cudadeep-learninggpunvidialinear-algebra - 最后活动时间: 2026-04-17
apex
NVIDIA官方PyTorch扩展,提供混合精度训练与分布式训练工具。
- Stars: ⭐️ 8.9k
- Tags:
mixed-precisiondistributed-trainingpytorch - 最后活动时间: 2026-04-13
ipex-llm
Intel XPU上的LLM推理和微调加速库,支持主流开源模型和多种推理框架集成。
- Stars: ⭐️ 8.8k
- Tags:
LLMIntelAcceleration - 最后活动时间: 2026-01-28
bitsandbytes
PyTorch量化工具库,提供k-bit量化支持,是LLM量化和高效推理的核心依赖库。
- Stars: ⭐️ 8.1k
- Tags:
QuantizationPyTorchLLM - 最后活动时间: 2026-04-17
OptiScaler
跨GPU的AI超分辨率和帧生成桥接工具,支持DLSS/XeSS/FSR输入转换,让非FG游戏也能使用FSR3帧生成技术。
- Stars: ⭐️ 7.9k
- Tags:
dlssfsrxessupscalingframe-generationgpu - 最后活动时间: 2026-04-18
tensorrtx
使用TensorRT网络定义API实现主流深度学习网络的高性能推理加速,支持YOLO系列、ResNet、Swin Transformer等热门模型。
- Stars: ⭐️ 7.7k
- Tags:
tensorrtdeep-learninginferenceyologpu-acceleration - 最后活动时间: 2026-03-07
rust-gpu
让Rust成为GPU着色器的一等编程语言,为AI计算和图形渲染提供现代化开发体验。
- Stars: ⭐️ 7.6k
- Tags:
rustgpu-programmingshadersgpu-compute - 最后活动时间: 2025-10-31
nvitop
交互式NVIDIA GPU进程监控管理工具,支持Prometheus导出和Grafana仪表板集成。
- Stars: ⭐️ 6.8k
- Tags:
GPU MonitoringNVIDIADevOps - 最后活动时间: 2026-04-01
ANE
通过逆向工程在Apple Neural Engine上训练神经网络的实验性项目。
- Stars: ⭐️ 6.6k
- Tags:
apple-neural-enginehardware-accelerationcore-ml - 最后活动时间: 2026-03-10
warp
NVIDIA开发的Python GPU加速框架,支持可微分编程,适用于物理仿真和空间计算。
- Stars: ⭐️ 6.5k
- Tags:
cudagpudifferentiable-programmingsimulationpython - 最后活动时间: 2026-04-18
ROCm
AMD开源GPU计算平台,为AI/ML工作负载提供高性能硬件加速支持,是NVIDIA CUDA的主要竞争对手。
- Stars: ⭐️ 6.4k
- Tags:
GPUAMDHardware AccelerationDeep Learning - 最后活动时间: 2026-04-17
stable-diffusion.cpp
纯C/C++实现的扩散模型推理框架,支持SD、Flux、Wan等多种模型,无需依赖即可高效运行。
- Stars: ⭐️ 5.8k
- Tags:
C++InferenceDiffusionGGML - 最后活动时间: 2026-04-18
DALI
NVIDIA开发的GPU加速数据处理库,为深度学习训练和推理提供高效的数据管道。
- Stars: ⭐️ 5.7k
- Tags:
deep-learninggpudata-processingimage-processing - 最后活动时间: 2026-04-17
tilelang
专为高性能GPU/CPU/加速器内核开发设计的领域特定语言,可显著简化AI算子优化流程。
- Stars: ⭐️ 5.5k
- Tags:
dslgpukernelhigh-performancecuda - 最后活动时间: 2026-04-18
flashinfer
专为LLM推理设计的高性能GPU内核库,支持注意力机制、MoE等关键算子的JIT编译优化。
- Stars: ⭐️ 5.4k
- Tags:
CUDALLM InferenceGPU KernelsAttention - 最后活动时间: 2026-04-18
tpu
Google Cloud TPU官方参考模型和工具集,支持大规模AI模型训练加速。
- Stars: ⭐️ 5.3k
- Tags:
TPUHardwareGoogle Cloud - 最后活动时间: 2026-03-25
cuml
NVIDIA RAPIDS机器学习库,提供GPU加速的经典ML算法实现,包括聚类、分类、回归等。
- Stars: ⭐️ 5.2k
- Tags:
cudamachine-learninggpurapids - 最后活动时间: 2026-04-18
rust-cuda
纯Rust编写的CUDA生态系统,支持在Rust中直接编写和执行高性能GPU代码,为AI模型训练和推理提供底层加速支持。
- Stars: ⭐️ 5.2k
- Tags:
cudagpurustgpgpu - 最后活动时间: 2026-04-16
arrayfire
通用GPU计算库,支持CUDA、OpenCL和CPU后端,为AI/ML工作负载提供高性能并行计算能力。
- Stars: ⭐️ 4.9k
- Tags:
GPUCUDAOpenCLHPC - 最后活动时间: 2026-03-07
gpustack
高性能GPU推理工具,支持vLLM/SGLang等引擎优化,实现卓越的LLM推理吞吐量和资源利用率。
- Stars: ⭐️ 4.9k
- Tags:
GPU InferencevLLMLLM Serving - 最后活动时间: 2026-04-17
mlx-lm
基于Apple MLX框架的大语言模型推理库,专为Apple Silicon芯片优化加速。
- Stars: ⭐️ 4.8k
- Tags:
MLXApple SiliconLLM - 最后活动时间: 2026-04-15
AITemplate
Meta开源的AI推理框架,将神经网络渲染为高性能CUDA/HIP C++代码,专为NVIDIA和AMD GPU推理优化。
- Stars: ⭐️ 4.7k
- Tags:
inferencecudagpuoptimization - 最后活动时间: 2026-04-09
nccl
NVIDIA开源的多GPU集合通信原语库,为深度学习分布式训练提供高效通信支持。
- Stars: ⭐️ 4.6k
- Tags:
cudagpudistributed-trainingcommunication - 最后活动时间: 2026-04-18
jetson-containers
为NVIDIA Jetson设备提供开箱即用的机器学习容器镜像,支持PyTorch、TensorFlow等主流框架。
- Stars: ⭐️ 4.6k
- Tags:
NVIDIAJetsonDockerML Containers - 最后活动时间: 2026-04-15
tiny-cuda-nn
轻量级高性能CUDA神经网络框架,支持实时MLP和NeRF渲染,速度极快。
- Stars: ⭐️ 4.5k
- Tags:
cudaneural-networkgpunerf - 最后活动时间: 2026-04-01
mlx-vlm
在Mac上使用MLX进行视觉语言模型推理和微调的工具包。支持LLaVA、Florence2、Pixtral等多种VLM模型。
- Stars: ⭐️ 4.4k
- Tags:
MLXVision LanguageApple Silicon - 最后活动时间: 2026-04-18
hip
AMD开发的C++异构计算接口,实现CUDA代码向AMD GPU的便携式迁移。
- Stars: ⭐️ 4.3k
- Tags:
cudahipgpuamdheterogeneous-computing - 最后活动时间: 2026-04-16
LACT
Linux GPU配置与监控工具,支持AMD和NVIDIA显卡,适用于AI开发者的GPU资源管理与性能调优。
- Stars: ⭐️ 4.2k
- Tags:
gpunvidiaamdgpulinuxmonitoring - 最后活动时间: 2026-04-18
xla
Google开源的机器学习编译器,优化GPU、CPU和ML加速器上的模型执行性能。
- Stars: ⭐️ 4.2k
- Tags:
compilergpuoptimizationtensorflow - 最后活动时间: 2026-04-19
oneDNN
Intel开源的深度神经网络库,针对多种CPU架构和硬件加速器进行优化,支持AVX512、AMX等指令集。
- Stars: ⭐️ 4.0k
- Tags:
Deep LearningNeural NetworkHardware Acceleration - 最后活动时间: 2026-04-17
Nunchaku
ICLR2025 Spotlight,面向4-bit扩散模型的量化方法,通过低秩组件吸收异常值实现高效生成。
- Stars: ⭐️ 3.8k
- Tags:
QuantizationDiffusionFlux - 最后活动时间: 2026-03-07
k8s-device-plugin
NVIDIA官方Kubernetes设备插件,支持在K8s集群中调度和管理GPU资源,是AI/ML工作负载部署的核心基础设施组件。
- Stars: ⭐️ 3.7k
- Tags:
kubernetesnvidiagpudevice-plugin - 最后活动时间: 2026-04-17
tvm-cn
TVM深度学习编译器框架的中文文档,涵盖模型优化、跨平台部署和硬件加速等核心内容。
- Stars: ⭐️ 3.7k
- Tags:
deep-learninggpumachine-learningtvmcompiler - 最后活动时间: 2026-03-12
StringZilla
高性能字符串处理库,支持SIMD和GPU加速,提供搜索、哈希、排序、编辑距离计算等功能,速度提升高达100倍。
- Stars: ⭐️ 3.4k
- Tags:
stringsimdgpucudaedit-distancesearch - 最后活动时间: 2026-03-23
zml
跨平台AI推理框架,支持任意模型和硬件,基于Zig语言构建,实现零妥协的高性能部署。
- Stars: ⭐️ 3.4k
- Tags:
aiinferencezigxlahpc - 最后活动时间: 2026-04-17
optimum
Hugging Face官方硬件优化工具包,加速Transformers和Diffusers模型的推理与训练,支持ONNX、量化及多硬件后端。
- Stars: ⭐️ 3.4k
- Tags:
模型优化推理加速量化 - 最后活动时间: 2026-04-15
HAMi
Kubernetes异构GPU共享解决方案,支持NVIDIA、华为昇腾、寒武纪等多种GPU的虚拟化与资源调度。
- Stars: ⭐️ 3.3k
- Tags:
kubernetesgpu-virtualizationgpu-sharingvgpu - 最后活动时间: 2026-04-17
SageAttention
ICLR2025/ICML2025/NeurIPS2025 Spotlight,量化注意力机制实现2-5倍加速,无损端到端性能。
- Stars: ⭐️ 3.3k
- Tags:
AttentionQuantizationAcceleration - 最后活动时间: 2026-01-17
TransformerEngine
NVIDIA推出的Transformer模型加速库,支持FP8/FP4低精度训练与推理,显著提升Hopper/Ada/Blackwell GPU性能并降低显存占用。
- Stars: ⭐️ 3.3k
- Tags:
deep-learninggpucudapytorchtransformers - 最后活动时间: 2026-04-17
cuda-python
NVIDIA官方CUDA Python绑定库,让Python开发者能够充分利用GPU并行计算能力,实现高性能计算。
- Stars: ⭐️ 3.2k
- Tags:
cudagpupythonnvidiahigh-performance - 最后活动时间: 2026-04-19
jittor
基于JIT编译和元算子的高性能深度学习框架,提供高效的模型训练与推理能力。
- Stars: ⭐️ 3.2k
- Tags:
deep-learninggpujitpythonneural-network - 最后活动时间: 2026-04-14
ComputeLibrary
Arm官方推出的计算机视觉与机器学习函数库,针对Arm CPU/GPU进行SIMD优化,支持NEON/SVE指令集。
- Stars: ⭐️ 3.1k
- Tags:
machine-learningcomputer-visionarmsimdneural-network - 最后活动时间: 2026-04-17
how-to-optim-algorithm-in-cuda
CUDA算法优化实践指南,涵盖LLM相关算子的GPU加速技巧。
- Stars: ⭐️ 2.9k
- Tags:
CUDAGPUOptimization - 最后活动时间: 2026-04-16
luminal
高性能深度学习框架,追求极致的计算速度优化。
- Stars: ⭐️ 2.8k
- Tags:
deep-learningperformanceframework - 最后活动时间: 2026-04-18
ao
PyTorch官方量化和稀疏性优化库,支持float8等现代数据类型,加速训练与推理。
- Stars: ⭐️ 2.8k
- Tags:
量化稀疏性PyTorch - 最后活动时间: 2026-04-19
xla
PyTorch XLA扩展,支持在TPU等XLA设备上运行深度学习训练。
- Stars: ⭐️ 2.8k
- Tags:
pytorchtpuxladeep-learning - 最后活动时间: 2025-12-18
futhark
一种数据并行函数式编程语言,可将高级代码编译为高性能GPU代码,支持CUDA和OpenCL。
- Stars: ⭐️ 2.7k
- Tags:
gpgpugpucompilercudaopencl - 最后活动时间: 2026-04-16
CV-CUDA
由ByteDance和NVIDIA联合开发的开源GPU加速计算机视觉库,专为云端大规模图像处理设计。
- Stars: ⭐️ 2.7k
- Tags:
computer-visioncudagpuimage-processing - 最后活动时间: 2026-03-31
xsimd
跨平台SIMD指令集封装库,支持SSE、AVX、NEON等指令集,为AI推理和数值计算提供硬件级加速优化。
- Stars: ⭐️ 2.7k
- Tags:
simdvectorizationhardware-accelerationcpp - 最后活动时间: 2026-04-18
ipyparallel
IPython并行计算框架,支持交互式并行数据处理与模型训练加速。
- Stars: ⭐️ 2.6k
- Tags:
parallel-computingipythondistributedpython - 最后活动时间: 2026-04-16
blis
高性能线性代数库,为AI框架提供底层矩阵运算加速支持。
- Stars: ⭐️ 2.6k
- Tags:
blaslinear-algebrahigh-performance-computingmatrix-operations - 最后活动时间: 2025-11-11
aimet
高通开发的神经网络量化压缩库,提供先进的量化和剪枝技术。
- Stars: ⭐️ 2.6k
- Tags:
模型量化模型压缩深度学习 - 最后活动时间: 2026-04-18
DirectML
微软推出的高性能机器学习GPU加速库,基于DirectX 12,支持AMD、Intel、NVIDIA等全系列GPU硬件加速。
- Stars: ⭐️ 2.6k
- Tags:
GPU加速DirectX机器学习 - 最后活动时间: 2026-02-20
kompute
基于Vulkan的通用GPU计算框架,支持跨厂商显卡,适用于深度学习和机器学习加速。
- Stars: ⭐️ 2.5k
- Tags:
gpu-computingvulkandeep-learning - 最后活动时间: 2026-04-13
neural-engine
Apple Neural Engine (ANE) 技术文档,涵盖CoreML、iOS神经网络加速等硬件细节。
- Stars: ⭐️ 2.5k
- Tags:
neural-enginecoremlioshardware-accelerationneural-network - 最后活动时间: 2026-03-12
TypeGPU
基于WebGPU的模块化工具包,支持TypeScript编写着色器,提供高级类型推断能力。
- Stars: ⭐️ 2.3k
- Tags:
webgpugpu-computingtypescriptgpgpu - 最后活动时间: 2026-04-18
XNNPACK
高效的浮点神经网络推理算子库,针对移动端、服务器和Web平台优化,支持SIMD加速。
- Stars: ⭐️ 2.3k
- Tags:
CPU推理SIMD移动端性能优化 - 最后活动时间: 2026-04-18
cccl
NVIDIA官方CUDA核心计算库,为AI框架提供GPU加速的基础计算能力,是深度学习底层优化的基石。
- Stars: ⭐️ 2.3k
- Tags:
CUDAGPUNVIDIA - 最后活动时间: 2026-04-18
Simd
C++高性能图像处理与机器学习库,利用SIMD指令集(SSE/AVX/NEON)实现硬件加速。
- Stars: ⭐️ 2.2k
- Tags:
simdimage-processingneural-network - 最后活动时间: 2026-04-17
coralnpu
面向边缘AI的能效优化机器学习加速器核心设计。
- Stars: ⭐️ 2.2k
- Tags:
npuedge-aihardware-acceleratormachine-learning - 最后活动时间: 2026-04-17
mirage
将LLM编译为持久化内核的优化框架,通过MegaKernel技术提升大模型推理性能。
- Stars: ⭐️ 2.2k
- Tags:
LLMKernelOptimization - 最后活动时间: 2026-04-19
cugraph
NVIDIA RAPIDS图分析库,提供GPU加速的大规模图计算和图神经网络支持。
- Stars: ⭐️ 2.2k
- Tags:
graph-analyticscudagpurapidsgraph-neural-network - 最后活动时间: 2026-04-17
ik_llama.cpp
llama.cpp的高性能分支,提供SOTA量化方案和优化的推理性能,适合本地部署大语言模型。
- Stars: ⭐️ 2.1k
- Tags:
llminferencequantizationcpp - 最后活动时间: 2026-04-18
dstack
开源GPU控制平面,支持在多云和本地环境运行AI开发、训练和推理任务,简化LLM和深度学习工作负载编排。
- Stars: ⭐️ 2.1k
- Tags:
GPUML InfrastructureTrainingInference - 最后活动时间: 2026-04-18
cubecl
多平台高性能计算语言扩展,支持CUDA、WebGPU等后端,为Rust提供GPU加速计算能力。
- Stars: ⭐️ 2.1k
- Tags:
GPUCUDAWebGPURust - 最后活动时间: 2026-04-18
pycuda
undefined
- Stars: ⭐️ 2.0k
- Tags:
cudagpugpu-computingpythonscientific-computing - 最后活动时间: 2026-03-27
cutile-python
NVIDIA cuTile Python编程模型,简化GPU并行内核开发,支持基于Tile的编程范式。
- Stars: ⭐️ 2.0k
- Tags:
cudagpukernelpythonparallel-computing - 最后活动时间: 2026-04-18
intel-extension-for-pytorch
Intel官方PyTorch扩展,优化Intel平台上的深度学习性能。
- Stars: ⭐️ 2.0k
- Tags:
pytorchinteloptimizationquantization - 最后活动时间: 2026-03-30
onediff
开箱即用的扩散模型加速库,支持Stable Diffusion、SDXL、ComfyUI等主流框架,显著提升推理性能。
- Stars: ⭐️ 2.0k
- Tags:
diffusion-modelsstable-diffusioncudainference-acceleration - 最后活动时间: 2025-12-04
vllm-ascend
vLLM在华为昇腾NPU上的硬件适配插件,支持在Ascend硬件上高效运行大模型推理服务。
- Stars: ⭐️ 1.9k
- Tags:
vLLMAscend硬件加速 - 最后活动时间: 2026-04-18
hls4ml
将机器学习模型部署到 FPGA 的开源库,利用高级综合技术实现神经网络硬件加速,适用于低延迟推理场景。
- Stars: ⭐️ 1.9k
- Tags:
FPGAHLS硬件加速边缘部署 - 最后活动时间: 2026-04-17
awesome-webgpu
WebGPU生态系统精选资源列表,涵盖GPU计算、3D图形和浏览器端机器学习推理加速技术。
- Stars: ⭐️ 1.9k
- Tags:
webgpugpu-computingmachine-learningbrowser-ai - 最后活动时间: 2026-01-21
scuda
GPU over IP 网络桥接工具,允许 CPU-only 机器远程挂载和使用远程 GPU 资源,支持 CUDA、cuDNN 等深度学习加速库。
- Stars: ⭐️ 1.9k
- Tags:
GPUCUDANetworkingMLOps - 最后活动时间: 2026-01-04
lapack
工业级线性代数计算库,是深度学习框架的核心依赖。
- Stars: ⭐️ 1.8k
- Tags:
lapackblaslinear-algebramatrix-factorizationsvd - 最后活动时间: 2026-04-19
AdaptiveCpp
跨平台异构计算编译器,支持SYCL、HIP/CUDA等多种编程模型,让AI应用无缝适配不同厂商的CPU和GPU硬件。
- Stars: ⭐️ 1.8k
- Tags:
syclgpu-computingheterogeneous-computingcudacompiler - 最后活动时间: 2026-04-17
NumKong
高性能SIMD加速数值计算库,支持16种数值类型的距离计算、矩阵运算和向量搜索,跨平台支持x86、Arm、RISC-V和WASM。
- Stars: ⭐️ 1.8k
- Tags:
SIMD数值计算向量搜索 - 最后活动时间: 2026-04-16
moderngpu
GPU计算模式与行为库,提供高效的并行算法实现,适用于深度学习底层优化。
- Stars: ⭐️ 1.8k
- Tags:
gpugpgpucudaparallel-computing - 最后活动时间: 2026-01-17
Vitis-AI
Xilinx官方AI推理开发栈,支持边缘设备和Alveo加速卡的AI模型部署。
- Stars: ⭐️ 1.8k
- Tags:
ai-inferencefpgaedge-aihardware-accelerationxilinx - 最后活动时间: 2026-02-24
VkFFT
跨平台高性能FFT库,支持Vulkan、CUDA、HIP、OpenCL等多种GPU后端,适用于AI音频处理和信号处理场景。
- Stars: ⭐️ 1.7k
- Tags:
fftcudavulkangpu-computingopencl - 最后活动时间: 2026-04-04
ILGPU
高性能 .NET GPU JIT 编译器,支持 CUDA、OpenCL 和 CPU 后端,为 AI 计算提供跨平台 GPU 加速能力。
- Stars: ⭐️ 1.7k
- Tags:
gpu-computingjit-compilercudaopencldotnet - 最后活动时间: 2026-04-17
dcgm-exporter
NVIDIA GPU监控指标导出器,集成DCGM为Prometheus提供GPU性能数据,适用于AI集群监控。
- Stars: ⭐️ 1.7k
- Tags:
gpuprometheusmonitoringnvidiakubernetes - 最后活动时间: 2026-04-07
compute
基于OpenCL的C++ GPU计算库,为AI/ML工作负载提供高性能并行计算能力。
- Stars: ⭐️ 1.6k
- Tags:
gpu-computingopenclgpgpuhpcparallel-computing - 最后活动时间: 2026-03-11
tfhe-rs
纯Rust实现的TFHE全同态加密方案,支持在加密数据上进行布尔和整数运算。为隐私保护AI和机密机器学习提供核心密码学基础设施。
- Stars: ⭐️ 1.6k
- Tags:
homomorphic-encryptioncryptographyprivacy-preservingrust - 最后活动时间: 2026-04-17
BarraCUDA
开源CUDA编译器,支持将CUDA代码编译至AMD和Tenstorrent GPU架构。
- Stars: ⭐️ 1.6k
- Tags:
CUDAcompilerGPUcross-platform - 最后活动时间: 2026-03-25
kernl
一行代码加速PyTorch Transformer模型GPU推理,基于Triton的高性能内核优化。
- Stars: ⭐️ 1.6k
- Tags:
CUDAPyTorchTransformerGPU - 最后活动时间: 2026-01-28
Enzyme
高性能自动微分编译器,支持LLVM和MLIR,为PyTorch、TensorFlow等深度学习框架提供梯度计算优化。
- Stars: ⭐️ 1.6k
- Tags:
Automatic DifferentiationCompilerDeep LearningLLVM - 最后活动时间: 2026-04-18
Anemll
专为Apple Neural Engine设计的机器学习库,支持在Apple Silicon上高效运行神经网络模型。
- Stars: ⭐️ 1.6k
- Tags:
machine-learningneural-engineapple-siliconcore-ml - 最后活动时间: 2026-03-10
Vitis-Tutorials
Xilinx Vitis深度教程,涵盖FPGA、HLS和AI引擎的硬件加速开发技术。
- Stars: ⭐️ 1.6k
- Tags:
fpgahlsaienginevitishardware-acceleration - 最后活动时间: 2026-03-25
FBGEMM
Facebook开源的高性能矩阵乘法库,专为深度学习推理优化,支持低精度计算和CPU加速。
- Stars: ⭐️ 1.6k
- Tags:
deep-learninginferencematrix-multiplicationoptimization - 最后活动时间: 2026-04-18
brevitas
PyTorch神经网络量化库,支持PTQ和QAT量化方法,优化模型在FPGA等硬件上的部署性能。
- Stars: ⭐️ 1.5k
- Tags:
quantizationpytorchfpga - 最后活动时间: 2026-04-16
gpu-hot
实时NVIDIA GPU监控仪表板,支持LLM训练和MLOps场景下的GPU资源可视化监控。
- Stars: ⭐️ 1.5k
- Tags:
GPU MonitoringNVIDIAMLOps - 最后活动时间: 2026-04-11
picolm
在10美元的开发板上运行10亿参数大语言模型的轻量级推理方案,支持256MB RAM的嵌入式设备。
- Stars: ⭐️ 1.5k
- Tags:
LLMEmbeddedQuantizationEdge AI - 最后活动时间: 2026-02-22
mllm
面向移动设备的高效多模态大语言模型推理框架,优化端侧性能。
- Stars: ⭐️ 1.5k
- Tags:
MultimodalMobileInference - 最后活动时间: 2026-04-12
nvidia_gpu_exporter
基于nvidia-smi的Prometheus GPU监控导出器,可实时监控GPU使用率、显存、温度等关键指标,适合AI训练和推理场景的资源监控。
- Stars: ⭐️ 1.5k
- Tags:
GPU监控PrometheusNVIDIA - 最后活动时间: 2026-04-18
lightning-thunder
PyTorch编译器,加速训练和推理过程。提供内置的性能、内存和并行优化,支持自定义优化扩展。
- Stars: ⭐️ 1.5k
- Tags:
pytorchcompileroptimizationdeep-learning - 最后活动时间: 2026-04-13
TornadoVM
一个高效的异构编程框架,支持Java等托管语言在GPU上运行,实现透明的并行计算加速。
- Stars: ⭐️ 1.4k
- Tags:
GPUCUDAParallel Computing - 最后活动时间: 2026-04-16
deepops
用于构建GPU集群的工具集,支持深度学习和HPC工作负载的部署与管理。
- Stars: ⭐️ 1.4k
- Tags:
gpuclusterdeep-learninghpcinfrastructure - 最后活动时间: 2026-02-23
tt-metal
Tenstorrent AI加速器底层编程框架,支持LLaMA、DeepSeek、Stable Diffusion等主流模型的硬件加速优化。
- Stars: ⭐️ 1.4k
- Tags:
AI加速器硬件优化LLM - 最后活动时间: 2026-04-19
MatX
现代C++20 GPU数值计算库,提供Python风格的简洁语法,专为高性能计算优化。
- Stars: ⭐️ 1.4k
- Tags:
GPU ComputingC++HPC - 最后活动时间: 2026-04-18
CUDA.jl
Julia语言的CUDA编程接口,提供完整的GPU计算支持和高性能并行编程能力。
- Stars: ⭐️ 1.4k
- Tags:
CUDAJuliaGPU - 最后活动时间: 2026-04-18
compute-runtime
Intel显卡计算运行时,支持oneAPI Level Zero和OpenCL驱动,为AI计算提供底层GPU加速支持。
- Stars: ⭐️ 1.4k
- Tags:
openclgpuintelcompute - 最后活动时间: 2026-04-17
scikit-learn-intelex
Intel推出的Scikit-learn加速扩展,通过oneAPI无缝提升机器学习算法性能,支持CPU/GPU加速。
- Stars: ⭐️ 1.3k
- Tags:
Scikit-learnGPU AccelerationIntelPerformance - 最后活动时间: 2026-04-18
eve
高性能C++ SIMD向量计算库,为机器学习和科学计算提供硬件加速支持。
- Stars: ⭐️ 1.3k
- Tags:
simdcpphpcvectorizationperformance - 最后活动时间: 2026-04-18
claude-code-local
在Apple Silicon上本地运行Claude Code,122B模型可达41 tok/s,无需云端和API费用。
- Stars: ⭐️ 1.3k
- Tags:
local-llmapple-siliconclaude-code - 最后活动时间: 2026-04-18
uccl
高效的GPU通信库,支持集合通信、P2P传输(KV缓存、RL权重)和端点通信,专为AI/LLM工作负载优化。
- Stars: ⭐️ 1.3k
- Tags:
GPURDMALLMHPC - 最后活动时间: 2026-04-18
armnn
Arm官方机器学习软件栈,为Arm处理器提供高效的神经网络推理加速。
- Stars: ⭐️ 1.3k
- Tags:
armmachine-learningneural-networkembedded - 最后活动时间: 2026-01-23
Oceananigans.jl
基于Julia的高性能流体动力学模拟框架,支持CPU和GPU加速计算,集成机器学习功能用于气候和海洋科学研究。
- Stars: ⭐️ 1.3k
- Tags:
fluid-dynamicsgpujuliamachine-learningscientific-computing - 最后活动时间: 2026-04-18
stdgpu
高效的GPU端STL风格数据结构库,支持CUDA和HIP,为GPU计算提供类STL的便捷接口。
- Stars: ⭐️ 1.3k
- Tags:
cudagpudata-structurescpphip - 最后活动时间: 2026-04-10
autokernel
自动化GPU内核优化工具,输入PyTorch模型自动生成优化的Triton内核。
- Stars: ⭐️ 1.2k
- Tags:
cudatritongpupytorchoptimization - 最后活动时间: 2026-03-19
awesome-high-performance-computing
高性能计算资源精选列表,涵盖HPC核心技术与资源,对大规模AI模型训练至关重要。
- Stars: ⭐️ 1.2k
- Tags:
hpchigh-performance-computingsupercomputingparallel-computing - 最后活动时间: 2026-04-17
gputil
Python模块,用于通过nvidia-smi以编程方式获取NVIDIA GPU的状态信息,适合AI训练监控。
- Stars: ⭐️ 1.2k
- Tags:
gpunvidiamonitoringpython - 最后活动时间: 2026-04-02
languagemodels
在512MB内存中运行大语言模型,适合边缘设备和低资源环境。
- Stars: ⭐️ 1.2k
- Tags:
llmedge-computingoptimization - 最后活动时间: 2026-02-19
FastFlowLM
专为AMD Ryzen AI NPU优化的本地LLM运行工具,类似Ollama但深度适配AMD硬件,充分发挥NPU加速能力。
- Stars: ⭐️ 1.2k
- Tags:
AMDNPU本地部署 - 最后活动时间: 2026-04-18
detect-gpu
基于3D渲染基准分数对GPU进行分类,帮助开发者为图形密集型AI应用提供合理的默认设置。
- Stars: ⭐️ 1.2k
- Tags:
gpu-detectionwebglhardware-detectionbenchmark - 最后活动时间: 2026-04-15
CLBlast
优化的OpenCL BLAS库,提供GPU加速的矩阵运算,是AI计算的基础设施组件。
- Stars: ⭐️ 1.2k
- Tags:
blasopenclgpulinear-algebra - 最后活动时间: 2026-04-13
keops
高效的内核运算库,支持CPU和GPU上的自动微分,无内存溢出问题,适用于大规模机器学习计算。
- Stars: ⭐️ 1.2k
- Tags:
gpuautodiffkernel-operationsmachine-learningpytorch - 最后活动时间: 2026-04-15
react-native-fast-tflite
高性能React Native TensorFlow Lite库,支持GPU加速,为移动端AI推理提供高效解决方案。
- Stars: ⭐️ 1.2k
- Tags:
TensorFlow LiteReact NativeMobile AI - 最后活动时间: 2026-04-17
NVTabular
NVIDIA开源的表格数据特征工程库,专为TB级推荐系统数据集设计,支持GPU加速预处理。
- Stars: ⭐️ 1.1k
- Tags:
deep-learningfeature-engineeringgpurecommendation-systemnvidia - 最后活动时间: 2026-03-12
pyopencl
Python的OpenCL集成库,提供GPU并行计算能力,支持多维数组和科学计算。
- Stars: ⭐️ 1.1k
- Tags:
openclgpupythonparallel-computing - 最后活动时间: 2026-04-06
neanderthal
高性能Clojure矩阵运算库,支持CPU和GPU加速,适用于机器学习和科学计算场景。
- Stars: ⭐️ 1.1k
- Tags:
clojurematrixgpucudaopencl - 最后活动时间: 2026-02-22
cudarc
Rust语言的CUDA安全封装库,提供CUDA、cuDNN、cuBLAS等工具的Rust绑定,便于GPU加速开发。
- Stars: ⭐️ 1.1k
- Tags:
cudarustgpucudnncublas - 最后活动时间: 2026-03-25
gunrock
高性能CUDA/C++ GPU图分析库,支持大规模图计算的并行加速。
- Stars: ⭐️ 1.1k
- Tags:
gpucudagraph-analyticsgnnhigh-performance - 最后活动时间: 2026-02-28
thrml
基于JAX构建的热力学超图模型库,支持概率计算与概率图模型的高效实现。
- Stars: ⭐️ 1.1k
- Tags:
jaxmachine-learningprobabilistic-computing - 最后活动时间: 2026-03-26
HugeCTR
NVIDIA开源的高效GPU框架,专为点击率(CTR)预估训练设计,支持大规模推荐系统。
- Stars: ⭐️ 1.1k
- Tags:
deep-learninggpu-accelerationrecommendation-systemctr - 最后活动时间: 2026-03-12
agi
Android官方GPU性能分析工具,支持AI应用性能调优与调试。
- Stars: ⭐️ 1.1k
- Tags:
androidgpuprofilerperformance - 最后活动时间: 2026-04-13
jaxopt
基于JAX的硬件加速、可批处理和可微分优化器库,支持多种优化算法的高效实现。
- Stars: ⭐️ 1.0k
- Tags:
jaxoptimizationdeep-learningdifferentiable-programming - 最后活动时间: 2025-12-17
auto-round
Intel开源的高精度LLM量化工具包,支持MXFP4、NVFP4、GGUF等多种格式,以精度优先设计最大限度减少量化损失。
- Stars: ⭐️ 1.0k
- Tags:
量化LLMIntel - 最后活动时间: 2026-04-18
cuda-quantum
NVIDIA量子计算编程框架,支持异构量子-经典混合工作流和量子机器学习。
- Stars: ⭐️ 1.0k
- Tags:
quantum-computingcudaquantum-mlnvidia - 最后活动时间: 2026-04-19
veScale
字节跳动开源的PyTorch分布式训练框架,专为LLM与RL大规模训练设计。
- Stars: ⭐️ 1.0k
- Tags:
pytorchdistributedllm-trainingscalable - 最后活动时间: 2026-03-03
onnx-mlir
基于MLIR编译器基础设施的ONNX模型表示与底层优化工具,支持将ONNX模型编译为高效机器码。
- Stars: ⭐️ 1.0k
- Tags:
onnxmlircompilermachine-learninginference - 最后活动时间: 2026-04-16
mlx-engine
LM Studio的Apple MLX推理引擎,专为Apple Silicon优化的本地模型运行方案。
- Stars: ⭐️ 1.0k
- Tags:
mlxapple-siliconlocal-inference - 最后活动时间: 2026-04-14
LuisaCompute
高性能跨平台渲染框架,支持CUDA、DirectX、Metal等多种后端,可用于AI图形计算加速。
- Stars: ⭐️ 1.0k
- Tags:
cudagpurenderingraytracingcross-platform - 最后活动时间: 2026-04-18
raft
NVIDIA提供的CUDA加速机器学习基础算法库,涵盖向量搜索、聚类、线性代数等核心原语,是高性能AI应用的基础构建块。
- Stars: ⭐️ 994
- Tags:
CUDA向量搜索GPU加速 - 最后活动时间: 2026-04-18
Tutel
优化的混合专家(MoE)库,支持GptOss/DeepSeek/Kimi-K2/Qwen3,兼容FP8/NVFP4/MXFP4量化。
- Stars: ⭐️ 984
- Tags:
MoEOptimizationInference - 最后活动时间: 2026-04-11
opt_einsum
优化NumPy、TensorFlow等框架中的einsum张量收缩运算,通过优化收缩顺序显著提升计算性能。
- Stars: ⭐️ 980
- Tags:
Tensor OptimizationPerformanceDeep Learning - 最后活动时间: 2026-03-19
SpargeAttn
ICML2025论文实现,无需训练的稀疏注意力机制,可加速任意模型推理,支持LLM、视频生成和视觉Transformer。
- Stars: ⭐️ 977
- Tags:
Sparse AttentionInference OptimizationICML2025 - 最后活动时间: 2026-02-25
spark-rapids
NVIDIA开发的Spark插件,利用GPU加速Apache Spark数据处理,显著提升大规模数据处理和机器学习工作负载的性能。
- Stars: ⭐️ 973
- Tags:
GPUSparkAccelerationBig Data - 最后活动时间: 2026-04-17
finn
用于FPGA上量化神经网络推理的数据流编译器,支持高效的硬件加速部署。
- Stars: ⭐️ 972
- Tags:
compilerfpganeural-networkquantization - 最后活动时间: 2026-04-17
cupynumeric
支持多节点多GPU系统的NumPy和SciPy加速库,为大规模科学计算和机器学习提供高性能数值计算能力。
- Stars: ⭐️ 968
- Tags:
gpunumpyscipyhpcnumerical-computing - 最后活动时间: 2026-04-18
accelerate
Haskell高性能数组计算嵌入式语言,支持GPU加速和并行计算。
- Stars: ⭐️ 955
- Tags:
haskellgpucudaparallel-computing - 最后活动时间: 2026-04-02
libxsmm
专注于密集和稀疏矩阵运算的优化库,为深度学习提供高性能计算原语。
- Stars: ⭐️ 949
- Tags:
blassimdmatrix-multiplicationdeep-learningintel - 最后活动时间: 2026-03-18
kineto
PyTorch官方使用的CPU/GPU性能分析库,提供时间线追踪和硬件性能计数器访问,帮助优化AI模型训练性能。
- Stars: ⭐️ 944
- Tags:
profilinggpupytorchperformancetracing - 最后活动时间: 2026-04-16
TheRock
轻量级开源构建系统,专为HIP和ROCm设计,支持AMD GPU的AI计算环境搭建。
- Stars: ⭐️ 941
- Tags:
rocmhipgpuamdbuild-system - 最后活动时间: 2026-04-19
cuda-tile
基于MLIR的CUDA内核优化编译器基础设施,专注于张量核心单元的Tile计算模式优化,提升AI推理性能。
- Stars: ⭐️ 940
- Tags:
mlircudacompilertensor-coregpu-optimization - 最后活动时间: 2026-04-01
hqq
半二次量化官方实现,高效压缩大模型同时保持性能。
- Stars: ⭐️ 929
- Tags:
quantizationllmoptimization - 最后活动时间: 2026-02-26
CUDA-Agent
基于大规模智能体强化学习的高性能CUDA内核生成框架,自动化GPU算子优化。
- Stars: ⭐️ 928
- Tags:
cudareinforcement-learningkernel-generationcode-generationoptimization - 最后活动时间: 2026-03-04
tpu-mlir
基于MLIR的机器学习编译器,专为Sophgo TPU加速器优化,支持LLM模型部署。
- Stars: ⭐️ 901
- Tags:
compilermlirtpullm - 最后活动时间: 2026-04-01
OmniQuant
ICLR 2024 Spotlight论文,简单高效的LLM量化技术,优化模型部署效率。
- Stars: ⭐️ 892
- Tags:
quantizationlarge-language-modelsoptimization - 最后活动时间: 2025-11-26
cuda-api-wrappers
轻量级、统一的C++风格CUDA API封装库,简化GPU编程开发。
- Stars: ⭐️ 880
- Tags:
cudagpugpgpucpp - 最后活动时间: 2026-02-16
nncase
开源深度学习编译器栈,专为Kendryte AI加速器设计,支持神经网络模型优化部署。
- Stars: ⭐️ 876
- Tags:
ai-compilerdeep-learningneural-networkllm - 最后活动时间: 2026-03-26
TinyNeuralNetwork
高效的深度学习模型压缩框架,支持剪枝、量化等模型优化技术。
- Stars: ⭐️ 874
- Tags:
model-compressionquantizationpruningpytorchdeep-learning - 最后活动时间: 2026-03-03
rotorquant
KV缓存压缩方案,通过块对角旋转实现。比TurboQuant更优的PPL表现,解码速度提升28%,预填充速度提升5.3倍,参数量减少44倍,支持llama.cpp直接集成。
- Stars: ⭐️ 861
- Tags:
quantizationkv-cachellmcompression - 最后活动时间: 2026-04-14
kvcached
虚拟化弹性KV缓存系统,支持动态GPU共享与多租户LLM推理,显著提升GPU资源利用率。
- Stars: ⭐️ 859
- Tags:
KV CacheGPU SharingLLM Inference - 最后活动时间: 2026-04-07
nvbench
NVIDIA CUDA内核基准测试库,帮助开发者精确测量和分析GPU内核性能。
- Stars: ⭐️ 854
- Tags:
cudabenchmarkgpunvidiaperformance - 最后活动时间: 2026-04-14
ComfyUI-MultiGPU
ComfyUI自定义节点,提供一键虚拟显存和多GPU集成支持,支持UNet和CLIP加载器的层卸载与Block Swap,最大化显卡潜空间利用。
- Stars: ⭐️ 850
- Tags:
ComfyUIMulti-GPUStable DiffusionVRAM优化 - 最后活动时间: 2026-03-21
amgcl
C++代数多重网格库,用于求解大规模稀疏线性系统,支持CUDA和OpenCL加速。
- Stars: ⭐️ 844
- Tags:
cudalinear-solversscientific-computingopencl - 最后活动时间: 2026-04-01
helion
一个Python嵌入式DSL,用于编写快速、可扩展的ML内核,减少样板代码。
- Stars: ⭐️ 841
- Tags:
ml-kernelsdslgpu-computingmachine-learning - 最后活动时间: 2026-04-19
causal-conv1d
高性能CUDA因果深度可分离一维卷积实现,提供PyTorch接口,适用于Mamba等状态空间模型。
- Stars: ⭐️ 837
- Tags:
cudapytorchconvolutionmambastate-space-model - 最后活动时间: 2026-03-10
InferenceX
开源连续推理基准测试工具,支持Qwen3.5、DeepSeek、GPT等主流模型在GB200、H100、MI355X等多种硬件平台上的性能对比评测。
- Stars: ⭐️ 825
- Tags:
BenchmarkInferenceGPU - 最后活动时间: 2026-04-18
sleef
SIMD数学函数库,提供向量化的基础函数和DFT实现,支持多种CPU架构。
- Stars: ⭐️ 824
- Tags:
simdmath-libraryfftvectorizationcuda - 最后活动时间: 2025-12-25
cuopt
NVIDIA GPU加速决策优化求解器,支持线性规划等优化问题的高性能计算。
- Stars: ⭐️ 823
- Tags:
cudaoptimizationgpulinear-programmingoperations-research - 最后活动时间: 2026-04-18
TheArtofHPC_pdfs
高性能计算系列书籍与课程资源,涵盖并行计算、科学计算等AI基础设施核心知识。
- Stars: ⭐️ 809
- Tags:
hpcparallel-computingscientific-computingcourse - 最后活动时间: 2026-01-29
RyzenAI-SW
AMD Ryzen AI 软件套件,提供在 AMD Ryzen AI PC 上优化和部署 AI 推理的工具与运行时库。
- Stars: ⭐️ 802
- Tags:
amdryzen-aiinferencehardware-acceleration - 最后活动时间: 2026-04-17
jax-js
JAX的JavaScript实现,支持WebGPU和Wasm,让机器学习模型可直接在浏览器中高效运行。
- Stars: ⭐️ 797
- Tags:
JAXMachine LearningWebGPUJavaScript - 最后活动时间: 2026-04-15
ocl
Rust 语言的 OpenCL 绑定库,为 AI 和科学计算提供 GPU 加速能力。
- Stars: ⭐️ 785
- Tags:
openclrustgpgpugpu-computing - 最后活动时间: 2026-02-23
PatrickStar
支持更大、更快、更绿色的NLP预训练模型,降低AI训练门槛。
- Stars: ⭐️ 777
- Tags:
bertpretrainingnlppytorch - 最后活动时间: 2025-11-18
gpu-jupyter
GPU加速的JupyterLab环境,预装TensorFlow和PyTorch,支持可复现的深度学习实验。
- Stars: ⭐️ 771
- Tags:
gpu-computingjupyterpytorchtensorflowdeep-learning - 最后活动时间: 2026-01-09
exllamav3
专为消费级GPU优化的LLM量化和推理库,支持在本地高效运行大语言模型。
- Stars: ⭐️ 770
- Tags:
LLMQuantizationInferenceGPU - 最后活动时间: 2026-04-18
oneMath
Intel oneAPI数学库,提供跨CPU/GPU的高性能BLAS、RNG等数学运算支持。
- Stars: ⭐️ 758
- Tags:
oneapiblasgpumath-library - 最后活动时间: 2026-03-30
GPUMD
基于GPU加速的分子动力学模拟工具,支持机器学习势能函数和神经网络势能,适用于材料科学和物理模拟领域。
- Stars: ⭐️ 754
- Tags:
cudamolecular-dynamicsmachine-learninggpuneural-network - 最后活动时间: 2026-04-19
NATTEN
快速多维稀疏注意力机制实现,为Transformer模型提供高效的局部注意力计算。
- Stars: ⭐️ 736
- Tags:
cudaattentionpytorchtransformersparse-attention - 最后活动时间: 2026-04-14
dgx-spark-playbooks
NVIDIA DGX Spark设备AI/ML工作负载部署指南集合,专为Blackwell架构优化。提供详细的步骤化配置手册。
- Stars: ⭐️ 731
- Tags:
nvidiadgxblackwellai-infrastructuregpu - 最后活动时间: 2026-04-14
ai-reference-models
Intel AI参考模型,针对Intel处理器和GPU优化的深度学习工作负载。
- Stars: ⭐️ 730
- Tags:
aicpudeep-learninginferencetensorflow - 最后活动时间: 2026-02-11
parca-agent
基于eBPF的持续性能分析工具,支持CPU和GPU性能监控,适用于Kubernetes环境下的AI工作负载优化。
- Stars: ⭐️ 717
- Tags:
profilinggpukubernetesobservabilitycuda - 最后活动时间: 2026-04-16
how-to-optimize-gemm
矩阵乘法优化教程,涵盖CPU和GPU上的GEMM高性能实现技术。
- Stars: ⭐️ 716
- Tags:
cudagemmoptimizationgpumatrix-multiplication - 最后活动时间: 2026-02-24
lava
Intel开源的神经形态计算软件框架,支持类脑计算和脉冲神经网络开发,适用于Loihi等神经形态硬件。
- Stars: ⭐️ 714
- Tags:
neuromorphic-computingneural-networksdeep-learningspiking-neural-networks - 最后活动时间: 2026-04-13
DCGM
NVIDIA数据中心GPU管理工具,用于收集GPU遥测数据和监控GPU健康状态,是AI基础设施运维的重要组件。
- Stars: ⭐️ 708
- Tags:
nvidiagputelemetrydata-centermonitoring - 最后活动时间: 2026-03-30
buddy-mlir
基于MLIR的编译器框架,连接领域特定语言(DSL)与领域特定架构(DSA),加速AI模型部署。
- Stars: ⭐️ 708
- Tags:
mlircompilerdslhardware-accelerationdeep-learning - 最后活动时间: 2026-04-18
Stim
高性能量子稳定器电路模拟库,支持量子错误校正和量子算法开发,适用于量子计算研究与AI硬件加速探索。
- Stars: ⭐️ 708
- Tags:
quantum-computingquantum-algorithmsquantum-simulationcirq - 最后活动时间: 2026-04-18
rmm
RAPIDS内存管理器,为CUDA应用提供高效的GPU内存分配和管理。
- Stars: ⭐️ 693
- Tags:
cudamemory-managementrapidsgpunvidia - 最后活动时间: 2026-04-16
magnetron
零依赖的C语言机器学习框架,提供现代Python API,支持CUDA加速,专注于执行和内存控制。
- Stars: ⭐️ 683
- Tags:
machine-learningneural-networkcudaml-framework - 最后活动时间: 2026-04-14
wgpu-py
Python的WebGPU接口实现,支持跨平台GPU计算与图形渲染。
- Stars: ⭐️ 664
- Tags:
webgpupythongpuvulkanmetal - 最后活动时间: 2026-04-13
qsim
高性能量子电路状态向量模拟器,支持C++和Python,用于量子计算研究与量子算法开发。
- Stars: ⭐️ 653
- Tags:
quantum-computingquantum-simulatorquantum-algorithmscpppython - 最后活动时间: 2026-04-13
qiskit-aer
IBM量子计算高性能电路模拟器,支持噪声模型和GPU加速,是量子机器学习研究的重要基础设施。
- Stars: ⭐️ 652
- Tags:
quantum-computingqiskitsimulatorgpu - 最后活动时间: 2026-02-26
qpp
现代C++量子计算库,提供量子态模拟和量子算法实现,支持量子门操作和量子电路构建。
- Stars: ⭐️ 651
- Tags:
quantum-computingcppsimulatorquantum - 最后活动时间: 2026-04-17
optiland
基于PyTorch的GPU加速光学设计工具,支持可微分光线追踪,适用于光学系统优化与仿真。
- Stars: ⭐️ 649
- Tags:
opticspytorchdifferentiableray-tracinggpusimulation - 最后活动时间: 2026-04-18
optiland
基于PyTorch的光学设计与仿真库,支持GPU加速和可微分光线追踪,适用于光学系统优化和科学计算。
- Stars: ⭐️ 649
- Tags:
pytorchray-tracingopticsdifferentiablegpu - 最后活动时间: 2026-04-18
oneDAL
Intel oneAPI数据分析库,提供高性能机器学习算法和数据分析功能,支持AI训练与推理加速。
- Stars: ⭐️ 645
- Tags:
machine-learningdata-analyticsoneapicpp - 最后活动时间: 2026-04-16
nCPU
面向模型原生和张量优化的CPU研究运行时,提供组织化的工作负载、工具和文档,适合AI推理优化研究。
- Stars: ⭐️ 637
- Tags:
cpu-optimizationtensorml-runtimeinference - 最后活动时间: 2026-04-18
cuCollections
NVIDIA开源的CUDA数据结构库,提供GPU加速的高性能哈希表、哈希集合等并发数据结构。
- Stars: ⭐️ 635
- Tags:
cudagpudatastructureshashmapnvidia - 最后活动时间: 2026-04-17
sonic-moe
针对混合专家模型(MoE)的IO和分块感知优化加速方案,提升大规模模型推理效率。
- Stars: ⭐️ 635
- Tags:
moeoptimizationaccelerationinference - 最后活动时间: 2026-04-18
loopy
面向CPU和GPU的数组计算代码生成器,支持自动优化和并行化。
- Stars: ⭐️ 629
- Tags:
cudacode-generationgpu-computingopencl - 最后活动时间: 2026-04-10
k8s-dra-driver-gpu
NVIDIA Kubernetes DRA驱动,为Kubernetes集群提供GPU资源调度和管理能力。
- Stars: ⭐️ 628
- Tags:
kubernetesnvidiagpudrainfrastructure - 最后活动时间: 2026-04-17
nvidia-dra-driver-gpu
NVIDIA DRA GPU驱动程序,为Kubernetes等容器编排平台提供GPU资源分配和管理能力。
- Stars: ⭐️ 628
- Tags:
nvidiagpukubernetesdriverdra - 最后活动时间: 2026-04-17
wincnn
Winograd最小化卷积算法生成器,用于优化卷积神经网络的计算效率。
- Stars: ⭐️ 627
- Tags:
cnnwinogradoptimizationdeep-learning - 最后活动时间: 2026-02-09
mlir-aie
基于MLIR的AMD AI Engine工具链,为NPU加速器提供编译器支持和开发框架。
- Stars: ⭐️ 620
- Tags:
mlirnpullvmcompilerhardware-acceleration - 最后活动时间: 2026-04-16
DFloat11
NeurIPS 2025论文,LLM与DiT的无损压缩方案,提升GPU推理效率。
- Stars: ⭐️ 619
- Tags:
compressionllmgpu-inference - 最后活动时间: 2025-11-24
vibetensor
AI辅助生成的深度学习系统,基于CUDA和CUTASS构建高性能计算框架。
- Stars: ⭐️ 616
- Tags:
cudacutlassdeep-learningpytorch - 最后活动时间: 2026-02-02
AI-windows-whl
为Windows平台预编译的AI加速库whl包,包含Flash-attention、SageAttention、NATTEN、xFormer等核心组件,简化AI开发环境配置。
- Stars: ⭐️ 598
- Tags:
aiflash-attentionwindowsprecompiledgpu-acceleration - 最后活动时间: 2026-04-01
aws-neuron-sdk
AWS专用机器学习芯片SDK,支持PyTorch和TensorFlow原生集成,提供高性能低成本推理。
- Stars: ⭐️ 593
- Tags:
awsmachine-learninghardware-acceleration - 最后活动时间: 2026-04-15
triattention
基于三角函数的KV缓存压缩技术,实现高效长推理,支持在显存受限的GPU上本地部署大语言模型。
- Stars: ⭐️ 587
- Tags:
kv-cachellm-inferencememory-optimizationgpu - 最后活动时间: 2026-04-15
dace
以数据为中心的并行编程框架,支持CUDA、FPGA等多种硬件加速后端。
- Stars: ⭐️ 581
- Tags:
cudafpgahpcparallel-computing - 最后活动时间: 2026-04-18
qkeras
TensorFlow Keras量化深度学习库,面向FPGA和ASIC硬件加速的模型量化工具。
- Stars: ⭐️ 580
- Tags:
quantizationkerasfpgahardware-accelerationdeep-learning - 最后活动时间: 2026-02-23
ginkgo
高性能数值线性代数库,支持多后端(CUDA、HIP、OpenMP),为AI和科学计算提供核心矩阵运算加速。
- Stars: ⭐️ 577
- Tags:
linear-algebragpu-computingcudahipsparse-matrixhpc - 最后活动时间: 2026-04-17
AutoDock-GPU
GPU加速的分子对接软件,用于药物发现和计算生物学研究,支持CUDA和OpenCL加速。
- Stars: ⭐️ 577
- Tags:
molecular-dockinggpu-computingcudadrug-discoverycomputational-biology - 最后活动时间: 2026-03-10
pplx-kernels
Perplexity 开源的高性能 GPU 内核库,用于加速 AI 推理计算。
- Stars: ⭐️ 567
- Tags:
gpu-kernelsperplexitycudainference - 最后活动时间: 2025-11-07
optimum-intel
HuggingFace Optimum Intel版,提供Intel硬件加速的模型推理优化工具。
- Stars: ⭐️ 566
- Tags:
optimizationintelopenvinoquantizationinference - 最后活动时间: 2026-04-17
astra-sim
用于大规模AI模型训练的层次化网络与 disaggregated 系统建模仿真器,帮助优化分布式训练架构设计。
- Stars: ⭐️ 562
- Tags:
distributed-trainingsimulationlarge-language-modelsnetwork-modeling - 最后活动时间: 2026-03-25
jetson-image
为Nvidia Jetson系列AI开发板创建最小化Ubuntu系统镜像的工具,支持边缘AI部署。
- Stars: ⭐️ 547
- Tags:
nvidia-jetsonedge-aiembedded-systemsubuntu - 最后活动时间: 2026-03-09
ComfyUI-Distributed
ComfyUI扩展插件,支持本地、远程和云端的多GPU分布式处理。
- Stars: ⭐️ 534
- Tags:
comfyuimulti-gpudistributed-computingstable-diffusion - 最后活动时间: 2026-04-08
mpi4jax
JAX数组零拷贝MPI通信库,为高性能计算应用提供分布式加速支持。
- Stars: ⭐️ 524
- Tags:
jaxmpihpcdistributed-computing - 最后活动时间: 2026-04-16
jetson-nano-baseboard
NVIDIA Jetson系列开发板的开源硬件底板设计,支持Jetson Nano、TX2 NX和Xavier NX,适用于边缘AI计算场景。
- Stars: ⭐️ 522
- Tags:
nvidiajetsonedge-aihardware - 最后活动时间: 2025-12-31
ROCm-docker
AMD ROCm 软件平台的 Docker 镜像集合,为 AI/ML 工作负载提供 GPU 加速环境支持。
- Stars: ⭐️ 517
- Tags:
dockerrocmgpuamddeep-learning - 最后活动时间: 2026-01-27
gpu-benches
GPU基础性能基准测试工具集合,用于测量GPU计算能力和缓存性能。
- Stars: ⭐️ 513
- Tags:
gpu-computingbenchmarkperformancemicro-benchmarks - 最后活动时间: 2025-10-24
Vitis-AI-Tutorials
AMD Xilinx Vitis AI框架官方教程,指导如何在FPGA平台上部署和加速深度学习推理。
- Stars: ⭐️ 510
- Tags:
vitis-aifpgaedge-aimodel-deployment - 最后活动时间: 2026-01-16
nvshmem
NVIDIA开发的并行编程接口,支持GPU间高效通信,可显著降低多进程通信开销,适用于深度学习分布式训练场景。
- Stars: ⭐️ 510
- Tags:
cudagpuparallel-computingdeep-learningnvidia - 最后活动时间: 2026-04-14
rkllama
专为Rockchip NPU优化的Ollama替代方案,支持在Orange Pi等开发板上高效运行LLM和深度学习模型。
- Stars: ⭐️ 505
- Tags:
llmnpurockchipedge-aillm-inference - 最后活动时间: 2026-04-16
mscclpp
MSCCL++是一个GPU驱动的通信栈,专为可扩展AI应用设计,优化分布式训练和推理的GPU间通信性能。
- Stars: ⭐️ 501
- Tags:
gpucommunicationdistributed-systemscudaai-infrastructure - 最后活动时间: 2026-04-17
pytorch
华为昇腾PyTorch适配器(torch_npu),为PyTorch提供昇腾NPU硬件加速支持。
- Stars: ⭐️ 501
- Tags:
pytorchascenddeep-learninghardware-acceleration - 最后活动时间: 2026-04-18
CUDA-L2
利用强化学习优化CUDA矩阵乘法内核,性能超越NVIDIA cuBLAS库。为大规模语言模型和深度学习提供更高效的GPU计算加速方案。
- Stars: ⭐️ 437
- Tags:
cudagpu-optimizationmatrix-multiplicationreinforcement-learninghardware-acceleration - 最后活动时间: 2026-03-30
Model Serving
tensorflow
Google开源的端到端机器学习框架,支持构建和部署深度学习模型,广泛应用于CV、NLP、推荐系统等领域。
- Stars: ⭐️ 194.8k
- Tags:
Deep LearningMachine LearningNeural Network - 最后活动时间: 2026-04-18
ollama
轻量级本地大模型运行工具,支持Llama、Qwen、DeepSeek等多种开源模型,一键部署即开即用。
- Stars: ⭐️ 169.4k
- Tags:
LLMLocal DeploymentModel Inference - 最后活动时间: 2026-04-18
llama.cpp
高性能C/C++实现的LLM推理引擎,支持GGML格式,广泛用于本地部署。
- Stars: ⭐️ 104.7k
- Tags:
推理C++GGML - 最后活动时间: 2026-04-18
pytorch
开源深度学习框架,提供强大的GPU加速和动态计算图支持,广泛应用于神经网络研究和生产环境。
- Stars: ⭐️ 99.3k
- Tags:
Deep LearningNeural NetworkGPU - 最后活动时间: 2026-04-19
fastapi
高性能异步Python Web框架,广泛用于AI模型API服务和生产部署。
- Stars: ⭐️ 97.4k
- Tags:
fastapiapiasyncpythonopenapi - 最后活动时间: 2026-04-17
vllm
高吞吐量LLM推理和服务引擎,采用PagedAttention技术优化显存利用率,广泛用于生产环境大模型部署。
- Stars: ⭐️ 77.2k
- Tags:
LLM推理模型服务高性能 - 最后活动时间: 2026-04-19
keras
面向人类的深度学习框架,提供简洁高级的API,支持多后端包括TensorFlow和PyTorch。
- Stars: ⭐️ 64.0k
- Tags:
深度学习Keras神经网络 - 最后活动时间: 2026-04-18
LocalAI
免费开源的OpenAI API替代方案,支持本地部署无需GPU,兼容OpenAI API接口。
- Stars: ⭐️ 45.5k
- Tags:
LLMSelf-hostedOpenAI APILocal Inference - 最后活动时间: 2026-04-18
airflow
Apache旗下开源工作流编排平台,支持以代码方式定义、调度和监控数据管道与ML工作流,是MLOps领域的核心基础设施工具。
- Stars: ⭐️ 45.1k
- Tags:
MLOps工作流编排数据管道 - 最后活动时间: 2026-04-19
litellm
统一LLM API网关和SDK,支持100+大模型API标准化调用,提供成本追踪、负载均衡等企业级功能。
- Stars: ⭐️ 43.8k
- Tags:
AI GatewayLLM ProxyOpenAI Compatible - 最后活动时间: 2026-04-19
exo
在本地运行前沿AI模型的分布式推理框架,支持多设备协同计算,无需GPU即可运行大语言模型。
- Stars: ⭐️ 43.8k
- Tags:
local-aillmdistributedinferenceedge-computing - 最后活动时间: 2026-04-18
ray
AI计算引擎,提供分布式运行时和AI库加速机器学习工作负载,支持深度学习、强化学习和LLM推理等场景。
- Stars: ⭐️ 42.2k
- Tags:
分布式计算机器学习LLM - 最后活动时间: 2026-04-18
BitNet
微软官方推出的1-bit LLM推理框架,实现极致压缩的高效大模型部署。
- Stars: ⭐️ 38.4k
- Tags:
1-bit LLMInferenceCompressionMicrosoft - 最后活动时间: 2026-03-10
gym
OpenAI开发的强化学习算法开发与对比工具包,提供标准化的环境接口,支持多种经典控制、Atari游戏等环境,是RL研究的标准基准平台。
- Stars: ⭐️ 37.2k
- Tags:
reinforcement-learningmachine-learningopenaisimulation - 最后活动时间: 2026-03-26
pytorch-image-models
最大的PyTorch图像编码器/骨干网络集合,包含ResNet、ViT、EfficientNet等预训练模型及训练推理脚本。
- Stars: ⭐️ 36.7k
- Tags:
Computer VisionPretrained ModelsPyTorch - 最后活动时间: 2026-04-17
detectron2
Facebook AI Research推出的下一代目标检测与分割平台,支持Mask R-CNN、RetinaNet等主流算法,模块化设计易于扩展。
- Stars: ⭐️ 34.3k
- Tags:
object-detectionsegmentationcomputer-visionpytorch - 最后活动时间: 2026-04-07
go-zero
云原生Go微服务框架,支持AI原生开发,提供代码生成和API网关功能,适合构建高性能AI服务后端。
- Stars: ⭐️ 32.9k
- Tags:
microservicesapi-gatewaygocloud-native - 最后活动时间: 2026-04-16
one-api
强大的LLM API管理与分发平台,统一OpenAI、Claude、Gemini等主流模型接口,支持Key管理与二次分发。
- Stars: ⭐️ 32.2k
- Tags:
API GatewayMulti-ModelKey Management - 最后活动时间: 2026-01-09
new-api
统一的AI模型聚合网关,支持将各类LLM转换为OpenAI/Claude/Gemini兼容格式,适合个人和企业的模型管理。
- Stars: ⭐️ 27.5k
- Tags:
AI GatewayLLMOpenAI Compatible - 最后活动时间: 2026-04-18
sglang
高性能的大语言模型和多模态模型服务框架,专注于推理优化和高效部署,提供卓越的服务性能。
- Stars: ⭐️ 26.1k
- Tags:
InferenceLLMCUDAServing - 最后活动时间: 2026-04-19
kratos
云原生时代的 Go 微服务框架,支持 gRPC、HTTP 和 MCP 协议,内置 AI 能力。
- Stars: ⭐️ 25.6k
- Tags:
microservicesgogrpcmcpcloud-native - 最后活动时间: 2026-04-04
mlflow
开源AI工程平台,支持调试、评估、监控和优化生产级AI应用,提供完整的机器学习生命周期管理。
- Stars: ⭐️ 25.4k
- Tags:
MLOpsLLMOps模型管理 - 最后活动时间: 2026-04-18
llamafile
Mozilla开源项目,将LLM打包为单一可执行文件,实现一键分发与运行。
- Stars: ⭐️ 24.2k
- Tags:
LLMDeploymentPortable - 最后活动时间: 2026-04-17
Paddle
百度开源的工业级深度学习框架,支持高性能单机与分布式训练,提供跨平台部署能力。
- Stars: ⭐️ 23.8k
- Tags:
deep-learningmachine-learningneural-networkdistributed-training - 最后活动时间: 2026-04-18
mlc-llm
通用LLM部署引擎,通过机器学习编译技术实现跨平台高效推理,支持多种硬件后端。
- Stars: ⭐️ 22.5k
- Tags:
LLM部署模型编译TVM推理优化 - 最后活动时间: 2026-04-14
prefect
Python工作流编排框架,用于构建弹性的数据管道和ML工作流,支持可观测性与自动化。
- Stars: ⭐️ 22.2k
- Tags:
WorkflowOrchestrationMLOps - 最后活动时间: 2026-04-17
onnx
机器学习互操作的开放标准,支持PyTorch、TensorFlow等主流框架间的模型转换与跨平台部署,是AI生态的核心基础设施。
- Stars: ⭐️ 20.7k
- Tags:
ONNXInteroperabilityModel Format - 最后活动时间: 2026-04-18
taipy
将数据和AI算法快速转化为生产级Web应用的Python框架,支持管道编排、数据可视化和场景分析。
- Stars: ⭐️ 19.2k
- Tags:
PythonMLOpsData VisualizationPipeline - 最后活动时间: 2026-04-18
livekit
端到端实时通信基础设施,专为连接人类与AI设计,支持语音、视频和WebRTC通信。
- Stars: ⭐️ 18.3k
- Tags:
realtimewebrtcvoice-aimedia-server - 最后活动时间: 2026-04-18
web-llm
基于WebGPU的浏览器端LLM推理引擎,无需服务器即可在浏览器中运行大模型,实现完全客户端AI推理。
- Stars: ⭐️ 17.8k
- Tags:
WebGPU浏览器AI本地推理 - 最后活动时间: 2026-04-15
openfang
开源智能体操作系统,基于Rust构建,支持MCP协议,为AI智能体提供底层运行环境。
- Stars: ⭐️ 16.8k
- Tags:
Agent OSMCPRust - 最后活动时间: 2026-04-17
kubeflow
Kubernetes上的机器学习工具包,提供完整的ML工作流编排与模型部署能力。
- Stars: ⭐️ 15.6k
- Tags:
kubernetesmachine-learningml-ops - 最后活动时间: 2026-01-05
dagster
现代化数据资产编排平台,专为数据工程和机器学习工作流设计,支持数据管道的开发、部署与监控。
- Stars: ⭐️ 15.3k
- Tags:
数据编排MLOpsETL - 最后活动时间: 2026-04-18
iii
统一后端架构引擎,通过Function、Trigger、Worker三个原语整合AI Agent与现有技术栈。
- Stars: ⭐️ 15.3k
- Tags:
backend-frameworkagentsgenaiprimitives - 最后活动时间: 2026-04-17
burn
新一代Rust深度学习框架,兼顾灵活性、效率和可移植性,支持CUDA、Metal、Vulkan、WebGPU等多后端。
- Stars: ⭐️ 14.9k
- Tags:
Deep-LearningRustCross-Platform - 最后活动时间: 2026-04-18
horovod
Uber开源的分布式训练框架,支持TensorFlow、PyTorch、MXNet等主流深度学习框架。
- Stars: ⭐️ 14.7k
- Tags:
Distributed TrainingTensorFlowPyTorch - 最后活动时间: 2025-12-01
casdoor
AI优先的身份认证与访问管理平台,支持MCP网关、OAuth 2.1、OIDC、SAML、LDAP等多种认证协议。
- Stars: ⭐️ 13.4k
- Tags:
IAMMCP GatewayAuthenticationSSO - 最后活动时间: 2026-04-18
or-tools
Google开源的运筹学优化工具套件,提供线性规划、约束规划、车辆路径等算法,广泛应用于AI优化问题。
- Stars: ⭐️ 13.4k
- Tags:
optimizationlinear-programmingoperations-research - 最后活动时间: 2026-04-17
tvm
开源机器学习编译器框架,支持跨平台GPU加速和深度学习模型优化部署。
- Stars: ⭐️ 13.3k
- Tags:
machine-learningcompilerdeep-learninggputensor - 最后活动时间: 2026-04-18
nano-vllm
轻量级vLLM实现,专注于大语言模型的高效推理,适合学习和轻量级部署场景。
- Stars: ⭐️ 13.0k
- Tags:
LLM推理引擎PyTorch - 最后活动时间: 2026-04-13
OpenLLM
开源大语言模型运行平台,支持将主流模型部署为OpenAI兼容的API端点,提供云端部署和服务管理的一站式解决方案。
- Stars: ⭐️ 12.3k
- Tags:
LLMInferenceOpenAI-Compatible - 最后活动时间: 2026-04-13
gateway
高性能AI网关,统一接入200+大语言模型和50+AI防护栏,提供单一API接口实现智能路由与安全管控。
- Stars: ⭐️ 11.4k
- Tags:
AI-GatewayLLMGuardrails - 最后活动时间: 2026-03-25
bisheng
开源企业级LLM DevOps平台,提供GenAI工作流、RAG、Agent、模型管理与微调等全方位功能。
- Stars: ⭐️ 11.3k
- Tags:
LLM平台RAGAgent工作流 - 最后活动时间: 2026-04-18
tensorzero
开源工业级LLM应用技术栈,集成LLM网关、可观测性、优化和评估功能,为生产级AI应用提供完整基础设施。
- Stars: ⭐️ 11.2k
- Tags:
LLMOpsLLM-GatewayObservability - 最后活动时间: 2026-04-18
claude-relay-service
一站式AI API中转服务,支持Claude、OpenAI、Gemini等多平台统一接入,降低使用成本。
- Stars: ⭐️ 11.2k
- Tags:
API RelayMulti-ModelClaude - 最后活动时间: 2026-04-16
wandb
AI开发者平台,提供模型训练跟踪、超参数调优和模型版本管理,从实验到生产的全流程MLOps解决方案。
- Stars: ⭐️ 11.0k
- Tags:
MLOpsExperiment TrackingModel Management - 最后活动时间: 2026-04-18
text-generation-inference
HuggingFace官方推出的大语言模型生产级推理框架,支持BLOOM、Falcon等主流模型的高效部署,提供张量并行和流式输出等高级特性。
- Stars: ⭐️ 10.8k
- Tags:
LLMInferenceDeployment - 最后活动时间: 2026-03-21
kedro
生产级数据科学工具箱,采用软件工程最佳实践构建可复现、可维护的机器学习流水线。
- Stars: ⭐️ 10.8k
- Tags:
MLOps流水线机器学习Python - 最后活动时间: 2026-04-17
mistral-inference
Mistral AI官方推理库,提供高效的大模型推理能力支持。
- Stars: ⭐️ 10.8k
- Tags:
LLM InferenceMistralModel Serving - 最后活动时间: 2026-02-26
triton-inference-server
NVIDIA开源的云端和边缘推理服务器,提供优化的AI模型部署解决方案。
- Stars: ⭐️ 10.6k
- Tags:
inferencedeep-learninggpumodel-serving - 最后活动时间: 2026-04-18
yolov3
YOLOv3目标检测模型的PyTorch实现,支持导出至ONNX、CoreML、TFLite等多种格式,便于跨平台部署。
- Stars: ⭐️ 10.6k
- Tags:
Object DetectionYOLOPyTorch - 最后活动时间: 2026-04-16
WasmEdge
轻量级高性能WebAssembly运行时,专为云原生、边缘计算和去中心化应用设计。支持AI模型推理、无服务器函数和微服务部署。
- Stars: ⭐️ 10.6k
- Tags:
WebAssemblyRuntimeEdge AIServerless - 最后活动时间: 2026-04-18
runanywhere-sdks
生产级本地 AI 运行工具包,支持 Android、iOS、Web 多平台部署,集成 LLM、多模态、语音 AI 等端侧推理能力。
- Stars: ⭐️ 10.3k
- Tags:
On-Device AICross-PlatformEdge AI - 最后活动时间: 2026-04-19
openvino
Intel开源的AI推理优化工具包,支持跨平台高性能部署计算机视觉、NLP和生成式AI模型。
- Stars: ⭐️ 10.1k
- Tags:
模型推理优化部署Intel - 最后活动时间: 2026-04-17
metaflow
Netflix开源的ML基础设施框架,支持分布式训练、LLM工作流和多云部署,提供完整的MLOps解决方案。
- Stars: ⭐️ 10.0k
- Tags:
MLOps分布式训练LLM工作流 - 最后活动时间: 2026-04-18
pytorch3d
FAIR官方3D深度学习库,提供可复用的3D数据处理组件和渲染功能。
- Stars: ⭐️ 9.9k
- Tags:
pytorch3d-deep-learningpoint-cloudrendering - 最后活动时间: 2026-03-18
cog
将机器学习模型打包成标准化容器的工具,支持CUDA和主流框架,简化AI模型的生产部署流程。
- Stars: ⭐️ 9.4k
- Tags:
ML OpsDockerModel Deployment - 最后活动时间: 2026-04-17
oneflow
深度学习框架,设计注重易用性、可扩展性和高效性,支持分布式训练。
- Stars: ⭐️ 9.4k
- Tags:
deep-learningframeworkdistributed-trainingmachine-learning - 最后活动时间: 2025-12-04
PowerInfer
面向本地部署的高速大语言模型推理引擎,显著提升本地LLM服务性能。
- Stars: ⭐️ 9.3k
- Tags:
LLM推理本地部署高性能 - 最后活动时间: 2026-01-24
inference
一行代码替换GPT为任意大语言模型,支持云端、本地和多模态模型推理。
- Stars: ⭐️ 9.2k
- Tags:
LLM推理模型部署OpenAI兼容 - 最后活动时间: 2026-04-17
coai
新一代多租户AI一站式解决方案,内置管理和计费系统。支持200+模型和35+提供商的企业级统一LLM网关,具备负载均衡、成本管理和文件解析等功能。
- Stars: ⭐️ 9.1k
- Tags:
AI GatewayLLMMulti-tenant - 最后活动时间: 2026-03-12
modelscope
阿里达摩院开源的模型即服务平台,提供丰富预训练模型库和Python SDK,覆盖CV、NLP、多模态等领域。
- Stars: ⭐️ 8.9k
- Tags:
Model-as-a-ServiceMulti-modalDeep Learning - 最后活动时间: 2026-04-17
vowpal_wabbit
微软开源的高性能机器学习系统,支持在线学习、强化学习、主动学习等多种前沿ML技术,适合大规模工业级应用场景。
- Stars: ⭐️ 8.7k
- Tags:
machine-learningonline-learningreinforcement-learningactive-learning - 最后活动时间: 2026-03-19
BentoML
一站式AI模型服务化平台,轻松构建推理API和LLM应用,支持生产级多模型管道部署。
- Stars: ⭐️ 8.6k
- Tags:
模型服务MLOpsLLM推理 - 最后活动时间: 2026-04-16
LMCache
为LLM提供极速KV缓存层,显著提升推理速度和吞吐量。支持vLLM、PyTorch等主流框架,兼容CUDA和ROCm。
- Stars: ⭐️ 8.0k
- Tags:
KV CacheLLM InferencevLLM - 最后活动时间: 2026-04-18
lmdeploy
高效的大语言模型压缩、部署和服务化工具包,支持多种主流LLM的推理加速与量化部署。
- Stars: ⭐️ 7.8k
- Tags:
LLM推理模型部署量化压缩 - 最后活动时间: 2026-04-17
h2o-3
开源分布式机器学习平台,支持多种算法和AutoML自动建模功能,可扩展处理大规模数据。
- Stars: ⭐️ 7.5k
- Tags:
机器学习AutoML分布式计算 - 最后活动时间: 2026-04-18
qiskit
IBM开源量子计算SDK,支持量子电路、算子和原语级别的编程,为量子机器学习提供基础。
- Stars: ⭐️ 7.3k
- Tags:
qiskitquantum-computingquantum-circuitsdkpython - 最后活动时间: 2026-04-18
flax
基于JAX的神经网络库,专为灵活性和高性能深度学习研究设计。
- Stars: ⭐️ 7.2k
- Tags:
jaxflaxneural-networkdeep-learning - 最后活动时间: 2026-04-18
tensorboard
TensorFlow官方可视化工具包,用于机器学习模型训练监控与分析。
- Stars: ⭐️ 7.1k
- Tags:
tensorflowvisualizationmachine-learningdeep-learning - 最后活动时间: 2026-04-16
openllmetry
基于OpenTelemetry的GenAI/LLM应用可观测性开源方案,提供全面的监控和追踪能力。
- Stars: ⭐️ 7.0k
- Tags:
ObservabilityOpenTelemetryMonitoring - 最后活动时间: 2026-04-17
mistral.rs
基于Rust的高性能LLM推理引擎,提供快速灵活的大语言模型部署能力。
- Stars: ⭐️ 7.0k
- Tags:
LLMInferenceRust - 最后活动时间: 2026-04-15
flyte
动态弹性的AI工作流编排平台,用于协调数据、模型和计算资源,支持Kubernetes原生部署和LLM工作流管理。
- Stars: ⭐️ 6.9k
- Tags:
OrchestrationMLOpsKubernetes - 最后活动时间: 2026-04-18
gemma.cpp
Google官方推出的轻量级C++推理引擎,专为Gemma大模型设计,支持本地高效部署和推理。
- Stars: ⭐️ 6.9k
- Tags:
inference-enginegemmacppllmlocal-deployment - 最后活动时间: 2026-04-17
monty
用 Rust 编写的最小化安全 Python 解释器,专为 AI 代理代码执行设计。
- Stars: ⭐️ 6.9k
- Tags:
python-interpreterrustai-sandboxcode-execution - 最后活动时间: 2026-04-18
guardrails
为大语言模型添加安全护栏的框架,确保AI输出符合规范与安全要求。
- Stars: ⭐️ 6.7k
- Tags:
LLM SafetyGuardrailsAI Security - 最后活动时间: 2026-04-03
clearml
一站式 MLOps/LLMOps 平台,提供实验管理、数据管理、流水线编排和模型服务。
- Stars: ⭐️ 6.6k
- Tags:
mlopsmachine-learningdeep-learningexperiment-management - 最后活动时间: 2026-04-16
zeppelin
基于 Web 的数据科学笔记本,支持 SQL、Scala、Spark 等多种语言,适用于大数据分析和 ML 工作流。
- Stars: ⭐️ 6.6k
- Tags:
notebookbig-datasparkdata-analyticsvisualization - 最后活动时间: 2026-04-18
dynamo
数据中心级分布式推理服务框架,专为大规模AI模型部署优化。
- Stars: ⭐️ 6.6k
- Tags:
Distributed InferenceDatacenterModel Serving - 最后活动时间: 2026-04-19
mmcv
OpenMMLab计算机视觉基础库,提供高质量的CV模型训练基础设施和通用组件。
- Stars: ⭐️ 6.4k
- Tags:
computer-visiondeep-learningpytorchopenmmlab - 最后活动时间: 2026-01-29
TensorFlow Serving
TensorFlow官方高性能模型服务系统,支持模型版本管理和多模型并行部署,专为生产环境设计。
- Stars: ⭐️ 6.4k
- Tags:
TensorFlow模型部署生产环境 - 最后活动时间: 2026-04-15
plano
面向智能体应用的AI原生代理和数据平面,内置编排、安全、可观测性和智能LLM路由功能。
- Stars: ⭐️ 6.4k
- Tags:
ai-gatewayllm-routingproxy - 最后活动时间: 2026-04-19
RWKV-Runner
仅8MB的RWKV模型管理启动工具,提供兼容OpenAI API接口,支持本地快速部署大模型。
- Stars: ⭐️ 6.3k
- Tags:
RWKVLLMOpenAI-API本地部署 - 最后活动时间: 2026-03-20
free_chatgpt_api
公益免费的 ChatGPT API 服务,支持 GPT-4,无需代理即可直连访问,兼容标准 OpenAI API 格式。
- Stars: ⭐️ 6.3k
- Tags:
chatgptopenai-apigpt-4free-apiproxy - 最后活动时间: 2025-11-27
ClawRouter
面向AI智能体原生的LLM路由器,支持41+模型且路由延迟低于1ms,集成USDC微支付功能。
- Stars: ⭐️ 6.2k
- Tags:
LLM路由AI Agents微支付 - 最后活动时间: 2026-04-13
greptimedb
开源可观测性数据库,统一存储指标、日志和追踪数据,支持AI/LLM监控场景。
- Stars: ⭐️ 6.2k
- Tags:
ObservabilityDatabaseLLM MonitoringOpenTelemetry - 最后活动时间: 2026-04-17
gpt-load
支持多渠道的AI代理服务,具备智能密钥轮询功能,轻松管理OpenAI、Claude、Gemini等多个AI提供商。
- Stars: ⭐️ 6.1k
- Tags:
AI代理密钥管理多渠道 - 最后活动时间: 2026-04-06
helicone
开源LLM可观测性平台,一行代码即可实现AI应用的监控、评估和实验管理。
- Stars: ⭐️ 5.5k
- Tags:
LLMOpsObservabilityMonitoringOpenAI - 最后活动时间: 2026-04-11
composer
MosaicML推出的模型训练加速库,提供高效的深度学习训练优化方案。
- Stars: ⭐️ 5.5k
- Tags:
deep-learningpytorchml-training - 最后活动时间: 2026-03-25
kgateway
云原生API网关和AI网关,支持Kubernetes环境下的微服务和AI模型流量管理。
- Stars: ⭐️ 5.5k
- Tags:
api-gatewayai-gatewaykubernetesenvoy - 最后活动时间: 2026-04-17
Daft
高性能AI数据引擎,支持图像、音频、视频和结构化数据的大规模处理,专为AI和多模态工作负载优化。
- Stars: ⭐️ 5.4k
- Tags:
Data EngineMultimodalDistributed Computing - 最后活动时间: 2026-04-18
kserve
CNCF旗下标准化AI模型推理平台,支持在Kubernetes上部署生成式和预测式AI模型,提供企业级模型服务解决方案。
- Stars: ⭐️ 5.3k
- Tags:
KubernetesModel-ServingLLM-Inference - 最后活动时间: 2026-04-18
zenml
开源MLOps平台,用于构建可生产的机器学习管道和AI代理工作流,支持从实验到生产的全生命周期管理。
- Stars: ⭐️ 5.3k
- Tags:
MLOpsPipelineLLMOps - 最后活动时间: 2026-04-18
genai-stack
生成式AI技术栈,集成LangChain、Docker、Neo4j和Ollama,快速部署AI应用。
- Stars: ⭐️ 5.3k
- Tags:
langchainollamaneo4jdockergenai - 最后活动时间: 2026-03-30
SynapseML
微软开源的分布式机器学习库,基于Apache Spark构建,支持深度学习、模型部署和认知服务集成。
- Stars: ⭐️ 5.2k
- Tags:
Machine LearningApache SparkDeep LearningModel Deployment - 最后活动时间: 2026-04-18
Mooncake
Moonshot AI开源的LLM推理服务平台,支持KVCache分离架构,为Kimi提供高性能推理服务。
- Stars: ⭐️ 5.1k
- Tags:
模型推理KVCacheRDMA - 最后活动时间: 2026-04-18
seldon-core
Kubernetes 原生 MLOps 框架,支持大规模机器学习模型的打包、部署、监控和管理。
- Stars: ⭐️ 4.7k
- Tags:
mlopskubernetesmodel-servingmachine-learning - 最后活动时间: 2026-03-23
aibrix
面向GenAI推理的高性价比可插拔基础设施组件。
- Stars: ⭐️ 4.7k
- Tags:
llm-inferenceinfrastructuregenaimodel-serving - 最后活动时间: 2026-04-17
text-embeddings-inference
HuggingFace出品的高性能文本嵌入模型推理解决方案,支持大规模向量检索场景。
- Stars: ⭐️ 4.7k
- Tags:
嵌入模型高性能推理HuggingFace - 最后活动时间: 2026-04-17
csghub
开源的LLM资产管理平台,类似Hugging Face的国产替代方案。支持模型、数据集、Agent的全生命周期管理,兼容HF SDK。
- Stars: ⭐️ 4.7k
- Tags:
LLM平台模型管理开源 - 最后活动时间: 2026-04-10
exllamav2
高效的本地LLM推理库,针对消费级GPU优化,实现快速模型运行。
- Stars: ⭐️ 4.5k
- Tags:
InferenceLocal LLMGPU - 最后活动时间: 2026-03-04
manifest
智能LLM路由方案,通过智能调度降低高达70%的API调用成本,支持可观测性监控。
- Stars: ⭐️ 4.5k
- Tags:
LLM RouterCost OptimizationObservability - 最后活动时间: 2026-04-18
CTranslate2
高效的Transformer模型推理引擎,支持量化优化和多平台加速,专为生产环境设计。
- Stars: ⭐️ 4.4k
- Tags:
推理引擎量化优化 - 最后活动时间: 2026-02-04
vllm-omni
面向全模态模型的高效推理框架,支持图像、视频、音频等多模态内容的生成与服务。
- Stars: ⭐️ 4.4k
- Tags:
InferenceMultimodalModel Serving - 最后活动时间: 2026-04-18
lite.ai.toolkit
轻量级C++ AI推理工具箱,支持多种后端,内置100+模型包括目标检测、分割、Stable Diffusion等功能。
- Stars: ⭐️ 4.4k
- Tags:
C++ONNXTensorRTYOLO - 最后活动时间: 2026-03-19
open_model_zoo
OpenVINO 预训练深度学习模型库,提供高质量、极快推理的各类 AI 模型,支持 PyTorch、TensorFlow、ONNX 等格式。
- Stars: ⭐️ 4.4k
- Tags:
deep-learningmodel-zooopenvinopretrained-modelsinference - 最后活动时间: 2026-04-10
LMOps
支持LLM和多模态大模型AI能力落地的通用技术框架,涵盖提示工程与预训练优化。
- Stars: ⭐️ 4.3k
- Tags:
LLM运维多模态提示工程 - 最后活动时间: 2026-04-18
logfire
专为生产环境 LLM 和智能体系统设计的可观测性平台,基于 OpenTelemetry 标准提供日志、指标和追踪功能。
- Stars: ⭐️ 4.2k
- Tags:
ObservabilityLLMOpenTelemetryMonitoring - 最后活动时间: 2026-04-18
mcpo
简单安全的MCP到OpenAPI代理服务器,实现AI模型协议的无缝转换与对接。
- Stars: ⭐️ 4.1k
- Tags:
MCPProxyOpenAPI - 最后活动时间: 2026-02-27
PINTO_model_zoo
海量预训练模型库,支持TensorFlow、PyTorch、ONNX等主流框架格式互转,覆盖边缘部署全场景。
- Stars: ⭐️ 4.1k
- Tags:
Model ConversionEdge DeploymentONNX - 最后活动时间: 2026-04-17
FedML
统一可扩展的机器学习库,支持大规模分布式训练、模型服务和联邦学习。
- Stars: ⭐️ 4.0k
- Tags:
federated-learningdistributed-trainingmlopsmodel-serving - 最后活动时间: 2025-10-28
dlrm
Meta开源的深度学习推荐模型实现,广泛应用于工业级推荐系统。
- Stars: ⭐️ 4.0k
- Tags:
recommendation-systemdeep-learningpytorchmeta - 最后活动时间: 2026-01-12
mini-sglang
SGLang的精简实现版本,帮助开发者深入理解现代LLM服务系统的核心原理与架构设计。
- Stars: ⭐️ 4.0k
- Tags:
LLM ServingEducational - 最后活动时间: 2026-03-13
LightLLM
轻量级高性能LLM推理服务框架,基于Titon实现,支持灵活扩展和高吞吐量部署。
- Stars: ⭐️ 4.0k
- Tags:
InferenceServingTriton - 最后活动时间: 2026-04-19
shimmy
基于Rust的高性能推理服务器,兼容OpenAI API,支持GGUF和SafeTensors格式,单二进制部署,支持热模型切换。
- Stars: ⭐️ 4.0k
- Tags:
inference-serverggufopenai-compatiblerustllm-inference - 最后活动时间: 2026-03-26
GenerativeAIExamples
NVIDIA官方生成式AI参考工作流,针对GPU加速基础设施和微服务架构优化。企业级部署最佳实践。
- Stars: ⭐️ 3.9k
- Tags:
GPU AccelerationMicroservicesLLM Inference - 最后活动时间: 2026-03-30
bifrost
高性能企业级AI网关,比LiteLLM快50倍,支持1000+模型、自适应负载均衡和护栏功能。
- Stars: ⭐️ 3.9k
- Tags:
ai-gatewayload-balancingguardrails - 最后活动时间: 2026-04-18
LitServe
轻量级Python AI推理服务框架,支持自定义逻辑、批处理和弹性扩展。
- Stars: ⭐️ 3.9k
- Tags:
model-servinginferenceapifastapi - 最后活动时间: 2026-04-13
atmosphere
JVM 平台的传输无关实时框架,支持 WebSocket、SSE、MCP 等多种协议的统一 API。
- Stars: ⭐️ 3.8k
- Tags:
mcpwebsocketjavaspring-bootreal-time - 最后活动时间: 2026-04-18
maestro
Netflix开源的工作流编排器,支持机器学习流水线、MLOps和智能体工作流的自动化调度与管理。
- Stars: ⭐️ 3.8k
- Tags:
WorkflowMLOpsOrchestrationData Pipelines - 最后活动时间: 2026-04-09
semantic-router
系统级智能路由器,支持云端、数据中心和边缘场景的混合模型路由,集成语义分类、PII检测和提示词防护功能。
- Stars: ⭐️ 3.7k
- Tags:
LLM路由AI网关Kubernetes - 最后活动时间: 2026-04-18
iree
基于MLIR的机器学习编译器和运行时工具包,支持跨平台部署TensorFlow、PyTorch、JAX等模型。
- Stars: ⭐️ 3.7k
- Tags:
MLIRCompilerCross-Platform - 最后活动时间: 2026-04-19
vidgear
高性能跨平台视频处理Python框架,支持实时流媒体、视频稳定和多线程处理。
- Stars: ⭐️ 3.7k
- Tags:
video-processingstreamingopencvffmpeg - 最后活动时间: 2026-04-17
FastDeploy
基于PaddlePaddle的高性能LLM/VLM推理部署工具包,提供高效的模型服务化能力。
- Stars: ⭐️ 3.7k
- Tags:
LLM ServingInferenceDeploymentPaddlePaddle - 最后活动时间: 2026-04-18
local-ai-packaged
一站式本地AI运行包,整合Ollama、Supabase、n8n、Open WebUI等工具,轻松部署私有AI环境。
- Stars: ⭐️ 3.7k
- Tags:
local-aiollamadockerself-hostedai-tools - 最后活动时间: 2026-02-26
singa
一个分布式深度学习平台,支持大规模模型训练与推理的高效部署。
- Stars: ⭐️ 3.6k
- Tags:
deep-learningdistributedmachine-learning - 最后活动时间: 2026-03-23
lemonade
本地AI应用发现与运行平台,支持GPU/NPU优化的LLM本地部署。
- Stars: ⭐️ 3.6k
- Tags:
Local LLMGPUMCP Server - 最后活动时间: 2026-04-18
archestra
企业级AI平台,提供安全护栏、MCP注册中心、网关和编排器,适用于生产环境。
- Stars: ⭐️ 3.6k
- Tags:
MCPAgentEnterpriseKubernetes - 最后活动时间: 2026-04-19
GraphScope
阿里巴巴开源的一站式大规模图计算系统,集成图分析、图计算和图神经网络能力,支持Gremlin查询语言。
- Stars: ⭐️ 3.5k
- Tags:
Graph ComputingGraph Neural NetworksBig Data - 最后活动时间: 2026-04-13
openai-gemini
无服务器代理,将Gemini API转换为OpenAI兼容格式,方便开发者统一调用。
- Stars: ⭐️ 3.5k
- Tags:
GeminiOpenAIProxyServerless - 最后活动时间: 2026-03-17
antigravity-claude-proxy
代理工具,将Antigravity提供的Claude和Gemini模型暴露为标准API,支持Claude Code和OpenClaw使用。
- Stars: ⭐️ 3.5k
- Tags:
ClaudeGeminiProxy - 最后活动时间: 2026-03-21
optillm
LLM推理优化代理服务器,支持Chain-of-Thought、MoE、MCTS等优化策略,提升模型推理效率。
- Stars: ⭐️ 3.4k
- Tags:
LLMInferenceOptimizationProxy - 最后活动时间: 2026-03-19
chitu
高性能大语言模型推理框架,专注于效率、灵活性和可用性,支持DeepSeek等主流模型的高效部署。
- Stars: ⭐️ 3.4k
- Tags:
LLMInferenceGPUModel Serving - 最后活动时间: 2026-04-18
llama-swap
为本地LLM服务器提供可靠的模型切换能力,兼容OpenAI/Anthropic API格式。
- Stars: ⭐️ 3.4k
- Tags:
Model Swappingllama.cppvLLM - 最后活动时间: 2026-04-18
FastVideo
统一的视频生成推理与后训练加速框架,支持扩散模型蒸馏和高效推理优化。
- Stars: ⭐️ 3.4k
- Tags:
视频生成推理加速扩散模型 - 最后活动时间: 2026-04-18
rlm
递归语言模型的通用推理库,支持多种沙箱环境,即插即用。
- Stars: ⭐️ 3.4k
- Tags:
inferencelanguage-modelsrlm - 最后活动时间: 2026-03-24
unitycatalog
开源多模态数据与AI目录管理平台,统一管理企业AI资产。
- Stars: ⭐️ 3.4k
- Tags:
catalogdata-managementai-governancemulti-modalenterprise - 最后活动时间: 2026-04-17
deep-prove
极速证明ML模型推理的框架,专注于零知识机器学习(ZKML)领域。为AI模型提供可验证推理能力。
- Stars: ⭐️ 3.3k
- Tags:
zkmlzk-snarksmachine-learningai-inference - 最后活动时间: 2026-04-01
whisper-asr-webservice
OpenAI Whisper语音识别的Docker化Web服务API,便于快速部署和集成。
- Stars: ⭐️ 3.2k
- Tags:
ASRAPIDocker - 最后活动时间: 2025-11-23
onnx-tensorrt
ONNX模型的TensorRT后端,实现高性能深度学习推理部署。
- Stars: ⭐️ 3.2k
- Tags:
onnxtensorrtdeep-learningnvidiainference - 最后活动时间: 2026-03-25
neo
AI原生应用运行时引擎,支持多线程和持久化场景图,实现智能体实时内省与动态修改。
- Stars: ⭐️ 3.2k
- Tags:
AI RuntimeAgent FrameworkMulti-threaded - 最后活动时间: 2026-04-19
opyrator
将机器学习代码快速转换为微服务,自动生成Web API和交互式GUI界面。
- Stars: ⭐️ 3.1k
- Tags:
deploymentfastapimachine-learning - 最后活动时间: 2026-03-30
RLinf
面向具身智能和智能体AI的强化学习基础设施框架,支持VLA-RL等前沿研究方向。
- Stars: ⭐️ 3.1k
- Tags:
reinforcement-learningembodied-aiagentic-aiinfrastructure - 最后活动时间: 2026-04-17
OmniRoute
多提供商LLM智能网关,提供OpenAI兼容接口,支持智能路由、负载均衡、重试回退、策略限流和可观测性功能。
- Stars: ⭐️ 3.1k
- Tags:
LLM GatewayModel RoutingRate Limiting - 最后活动时间: 2026-04-19
axonhub
开源AI网关,支持100+大语言模型,内置故障转移、负载均衡、成本控制和端到端追踪功能。
- Stars: ⭐️ 3.1k
- Tags:
AI GatewayLLM负载均衡 - 最后活动时间: 2026-04-18
folib
全语言制品仓库,支持Huggingface等主流AI模型仓库的代理与同步。
- Stars: ⭐️ 3.1k
- Tags:
aimodelsartifact-repositoryhuggingfacedocker-registrymaven - 最后活动时间: 2025-12-24
graphjin
自动编译器,将AI应用与数据库无缝连接,支持多种数据库后端。
- Stars: ⭐️ 3.0k
- Tags:
databasegraphqlsqlapi - 最后活动时间: 2026-04-17
cake
分布式推理框架,支持移动端、桌面和服务器端的AI模型推理部署。
- Stars: ⭐️ 3.0k
- Tags:
Distributed InferenceModel ServingCross-Platform - 最后活动时间: 2026-04-05
llm-d
专注于在Kubernetes上实现大语言模型高性能推理的部署框架,支持现代加速器以达成业界领先的推理性能。
- Stars: ⭐️ 3.0k
- Tags:
KubernetesLLM InferenceHigh Performance - 最后活动时间: 2026-04-18
weld
斯坦福开源的高性能数据分析运行时,通过LLVM代码生成优化Pandas、Spark等数据框架的执行效率。
- Stars: ⭐️ 3.0k
- Tags:
data-analyticsllvmperformancerustmachine-learning - 最后活动时间: 2026-04-13
algernon
一个轻量级的纯Go Web服务器,内置Ollama支持,可便捷部署和运行本地LLM服务。
- Stars: ⭐️ 3.0k
- Tags:
GoOllamaWeb ServerLLM Serving - 最后活动时间: 2026-04-18
TensorRT
NVIDIA官方的PyTorch模型编译器,利用TensorRT优化深度学习模型在GPU上的推理性能。
- Stars: ⭐️ 3.0k
- Tags:
tensorrtdeep-learninginferencenvidiapytorch - 最后活动时间: 2026-04-18
ultralyticsPro
YOLO系列目标检测模型改进合集,支持YOLO11/v8/v10/v7/v5及RT-DETR等模型优化。
- Stars: ⭐️ 2.9k
- Tags:
yoloobject-detectionpytorchdeep-learning - 最后活动时间: 2025-12-15
uvicorn-gunicorn-fastapi-docker
高性能FastAPI生产级Docker镜像,集成Uvicorn和Gunicorn,支持自动性能调优。
- Stars: ⭐️ 2.9k
- Tags:
fastapidockermodel-servingpythonasgi - 最后活动时间: 2026-03-25
distributed-llama
分布式LLM推理框架,可将多台家用设备连接成集群加速大模型推理,设备越多推理越快。
- Stars: ⭐️ 2.9k
- Tags:
分布式推理集群计算LLM - 最后活动时间: 2026-04-14
spiceai
Rust 编写的便携式加速 SQL 查询、搜索和 LLM 推理引擎,为数据驱动的 AI 应用和智能体提供基础设施支持。
- Stars: ⭐️ 2.9k
- Tags:
SQLLLM推理数据联邦Rust - 最后活动时间: 2026-04-19
tract
轻量级、自包含的TensorFlow和ONNX推理引擎,使用Rust编写,适合嵌入式和边缘部署。
- Stars: ⭐️ 2.9k
- Tags:
RustONNXTensorFlow推理引擎 - 最后活动时间: 2026-04-17
docker-agent
AI智能体构建与运行时平台,借助Docker容器化优势,让Agent的构建、测试和生产部署更加简单高效。
- Stars: ⭐️ 2.8k
- Tags:
DockerRuntimeDeployment - 最后活动时间: 2026-04-18
leptonai
Pythonic框架,简化AI服务的构建与部署流程,提供高效的模型服务化解决方案。
- Stars: ⭐️ 2.8k
- Tags:
ai-servingdeep-learninggpupythondeployment - 最后活动时间: 2026-04-16
lmnr
专为AI智能体打造的开源可观测性平台,提供全链路追踪、评估和监控能力,YC S24孵化项目。
- Stars: ⭐️ 2.8k
- Tags:
可观测性LLMOps监控 - 最后活动时间: 2026-04-17
infinity
高性能文本嵌入和重排序模型服务引擎,支持CLIP、CLAP和ColPali等多种模型。
- Stars: ⭐️ 2.8k
- Tags:
Text EmbeddingsModel ServingReranking - 最后活动时间: 2026-03-24
one-hub
OpenAI接口管理与分发系统,支持多模型接入、统计页面及函数调用完善。
- Stars: ⭐️ 2.8k
- Tags:
openai-apiapi-gatewaymodel-managementchatgpt - 最后活动时间: 2026-02-19
ramalama
基于容器技术的AI模型部署工具,简化本地服务和生产环境推理,支持llama.cpp、vLLM等多种引擎。
- Stars: ⭐️ 2.8k
- Tags:
容器化模型部署推理引擎 - 最后活动时间: 2026-04-18
torch-points3d
点云深度学习PyTorch框架,支持PointNet、KPConv等主流架构和分割任务。
- Stars: ⭐️ 2.7k
- Tags:
point-cloudpytorchdeep-learningsegmentation - 最后活动时间: 2026-03-16
BigDL
分布式深度学习框架,支持在Apache Spark/Flink和Ray上运行TensorFlow、Keras和PyTorch。
- Stars: ⭐️ 2.7k
- Tags:
deep-learningdistributedtensorflowpytorchspark - 最后活动时间: 2026-04-08
cc-gateway
AI API身份网关,作为反向代理标准化设备指纹和遥测数据,实现隐私保护的API代理服务。
- Stars: ⭐️ 2.7k
- Tags:
api-gatewayanthropicclaudeprivacyreverse-proxy - 最后活动时间: 2026-04-02
9router
统一路由工具,连接Claude Code、Cursor、Copilot等AI编程工具到40+服务商和100+模型,简化多模型接入。
- Stars: ⭐️ 2.7k
- Tags:
AI RouterCode AssistantMulti-ModelAPI Gateway - 最后活动时间: 2026-04-17
secretflow
隐私保护数据分析与机器学习统一框架,支持联邦学习、差分隐私和安全多方计算。
- Stars: ⭐️ 2.6k
- Tags:
privacy-preservingfederated-learningdifferential-privacysecure-computation - 最后活动时间: 2025-11-13
neural-compressor
Intel 开发的 SOTA 模型压缩工具,支持 INT8/FP8/INT4 等低比特量化、稀疏化和剪枝,优化 LLM 在各种硬件上的部署效率。
- Stars: ⭐️ 2.6k
- Tags:
QuantizationLLMModel CompressionIntel - 最后活动时间: 2026-04-17
neural-compressor
Intel 开发的 SOTA 模型压缩工具,支持 INT8/FP8/INT4 等低比特量化、稀疏化和剪枝,优化 LLM 在各种硬件上的部署效率。
- Stars: ⭐️ 2.6k
- Tags:
QuantizationLLMModel CompressionIntel - 最后活动时间: 2026-04-17
krakend-ce
高性能API网关,专为AI模型服务设计,支持GraphQL、微服务架构和云原生部署。
- Stars: ⭐️ 2.6k
- Tags:
ai-gatewayapi-gatewaygomicroservicegraphql - 最后活动时间: 2026-04-10
connector-x
高性能数据库到DataFrame数据加载库,支持Rust和Python,为机器学习数据管道提供极速数据读取能力。
- Stars: ⭐️ 2.6k
- Tags:
databasedataframepythonrustsql - 最后活动时间: 2026-04-17
deepdetect
C++14深度学习API服务器,支持PyTorch、TensorRT、TensorFlow等多框架模型部署。
- Stars: ⭐️ 2.5k
- Tags:
deep-learningpytorchtensorrtmodel-serving - 最后活动时间: 2026-04-17
claude-code-hub
Claude Code与Codex API代理服务,提供智能负载均衡、用户管理和使用统计。
- Stars: ⭐️ 2.5k
- Tags:
Claude APIProxyLoad Balancing - 最后活动时间: 2026-04-18
tensorflow-onnx
TensorFlow、Keras、TensorFlow.js和TFLite模型转换为ONNX格式的官方工具。
- Stars: ⭐️ 2.5k
- Tags:
onnxtensorflowkerasmodel-conversiondeep-learning - 最后活动时间: 2026-04-02
Model-Optimizer
统一的模型优化库,集成量化、剪枝、蒸馏、投机解码等SOTA技术,支持TensorRT-LLM、vLLM等部署框架,显著提升推理速度。
- Stars: ⭐️ 2.5k
- Tags:
Model OptimizationQuantizationInference - 最后活动时间: 2026-04-19
faer-rs
Rust语言的高性能线性代数基础库,为机器学习和科学计算提供核心数学运算支持。
- Stars: ⭐️ 2.5k
- Tags:
linear-algebramatrixrustmachine-learning - 最后活动时间: 2026-01-26
hamilton
Apache项目,帮助定义可测试、模块化的数据流,支持ML/LLM工作流编排与血缘追踪。
- Stars: ⭐️ 2.5k
- Tags:
DataflowMLOpsETL - 最后活动时间: 2026-04-17
claude-code-proxy
Claude Code 到 OpenAI API 的代理转换工具,实现接口兼容。
- Stars: ⭐️ 2.4k
- Tags:
claude-codeopenaiproxyapi - 最后活动时间: 2026-03-12
tensorflow-federated
Google开源的去中心化机器学习框架,支持在分布式数据上进行模型训练与推理。
- Stars: ⭐️ 2.4k
- Tags:
federated-learningtensorflowdecentralized-ml - 最后活动时间: 2026-04-18
agentgateway
新一代AI代理网关,支持MCP服务器和AI代理的代理与路由。
- Stars: ⭐️ 2.4k
- Tags:
ai-gatewaymcpagentskubernetesrust - 最后活动时间: 2026-04-17
openlit
OpenTelemetry原生AI工程平台,提供LLM可观测性、GPU监控、护栏和提示词管理等一站式解决方案。
- Stars: ⭐️ 2.4k
- Tags:
LLM ObservabilityOpenTelemetryAI Engineering - 最后活动时间: 2026-04-17
ailia-models
ailia SDK 的预训练模型集合,涵盖图像分类、目标检测、姿态估计等多种 SOTA 模型。
- Stars: ⭐️ 2.3k
- Tags:
Pre-trained ModelsInferenceMulti-task - 最后活动时间: 2026-04-18
langserve
LangChain官方部署工具,将LangChain应用快速打包为生产级REST API服务。
- Stars: ⭐️ 2.3k
- Tags:
LangChainDeploymentFastAPILLM - 最后活动时间: 2026-04-16
instill-core
全栈AI基础设施工具,提供数据、模型和流水线编排能力,支持低代码方式快速构建AI应用。
- Stars: ⭐️ 2.3k
- Tags:
AI基础设施流水线编排低代码 - 最后活动时间: 2026-04-19
gluon-api
简洁高效的深度学习API框架,提供清晰易用的神经网络开发接口。
- Stars: ⭐️ 2.3k
- Tags:
deep-learningneural-networkapiframework - 最后活动时间: 2026-01-14
Olive
微软开源的ML模型优化工具,简化模型微调、量化、转换和部署流程,支持CPU/GPU/NPU。
- Stars: ⭐️ 2.3k
- Tags:
model-optimizationquantizationfinetuningonnx - 最后活动时间: 2026-04-18
production-stack
vLLM官方Kubernetes集群部署方案,提供生产级LLM推理服务部署与性能优化。
- Stars: ⭐️ 2.3k
- Tags:
vllmkubernetesllm-servinginferenceproduction - 最后活动时间: 2026-04-16
EAGLE
推测解码官方实现,显著加速大语言模型推理(ICML/EMNLP/NeurIPS系列论文)。
- Stars: ⭐️ 2.3k
- Tags:
speculative-decodingllm-inferenceinference-acceleration - 最后活动时间: 2026-02-20
AIstudioProxyAPI
兼容OpenAI API格式的Google AI Studio代理服务,支持参数转发和调试WebUI面板。
- Stars: ⭐️ 2.3k
- Tags:
google-ai-studioproxyopenai-apimiddleware - 最后活动时间: 2026-04-18
CGraph
跨平台无依赖的C++/Python并行计算DAG框架,适用于AI工作流和Agent流水线编排。
- Stars: ⭐️ 2.3k
- Tags:
dagpipelineworkflowai-agentsparallel-computing - 最后活动时间: 2026-04-11
inference
计算机视觉推理服务器,支持YOLO等模型在边缘设备上的部署。
- Stars: ⭐️ 2.3k
- Tags:
computer-visioninferenceobject-detectionyolo - 最后活动时间: 2026-04-18
LiteRT
Google端侧AI框架,TensorFlow Lite继任者,支持边缘平台高性能ML与GenAI部署。
- Stars: ⭐️ 2.2k
- Tags:
edge-aion-device-mltensorflow-litemodel-deployment - 最后活动时间: 2026-04-19
metamcp
一体化MCP聚合网关,集成编排、中间件和代理功能,支持Docker一键部署。
- Stars: ⭐️ 2.2k
- Tags:
MCPGatewayOrchestration - 最后活动时间: 2026-02-08
fairlearn
评估和改进机器学习模型公平性的Python库,促进负责任AI发展。
- Stars: ⭐️ 2.2k
- Tags:
fairnessresponsible-aimachine-learningpython - 最后活动时间: 2026-04-14
cc-mirror
创建多个隔离的 Claude Code 变体,支持 Z.ai、MiniMax、OpenRouter 等自定义提供商。
- Stars: ⭐️ 2.2k
- Tags:
claude-codemulti-providerproxy - 最后活动时间: 2026-03-06
ort
Rust 语言实现的高性能 ONNX 模型推理和训练框架。
- Stars: ⭐️ 2.2k
- Tags:
onnxinferencerustmachine-learningai-training - 最后活动时间: 2026-04-17
floneum
Rust编写的本地AI模型推理框架,支持即时、可控的预训练模型运行。
- Stars: ⭐️ 2.2k
- Tags:
RustLLMLocal AIWhisper - 最后活动时间: 2026-04-16
tfx
TensorFlow Extended 端到端生产级 ML 流水线平台,支持模型训练、验证和部署全流程。
- Stars: ⭐️ 2.2k
- Tags:
tensorflowmlopsml-pipelineproduction - 最后活动时间: 2026-04-16
metapi
AI API 聚合网关工具,将多个 AI API 服务(如 New API、One API 等)统一汇聚为单一入口,支持自动发现模型、智能路由和成本优化。
- Stars: ⭐️ 2.2k
- Tags:
ai-apiapi-gatewaymodel-routingopenai-compatible - 最后活动时间: 2026-04-18
dify-plus
Dify企业级增强版,集成管理中心并针对企业场景优化。
- Stars: ⭐️ 2.1k
- Tags:
difyenterprisellm-platformai-platform - 最后活动时间: 2026-04-16
llama2.mojo
使用纯Mojo语言实现的Llama 2推理引擎,单文件高效运行,支持SIMD和向量化加速。
- Stars: ⭐️ 2.1k
- Tags:
MojoLlama2InferencePerformance - 最后活动时间: 2026-02-09
subnet-2
基于Bittensor的去中心化可验证AI推理网络,利用零知识证明技术确保推理结果的可信度与透明性。
- Stars: ⭐️ 2.1k
- Tags:
bittensorzkmlinferenceblockchain - 最后活动时间: 2026-04-17
llama_deploy
LlamaIndex 官方部署工具,将智能体工作流快速部署到生产环境。
- Stars: ⭐️ 2.1k
- Tags:
agentsdeploymentllamaindexllmmulti-agents - 最后活动时间: 2026-04-06
OnnxStream
轻量级ONNX推理库,支持在树莓派Zero 2上运行SDXL,支持Mistral、Whisper等多种模型。
- Stars: ⭐️ 2.1k
- Tags:
ONNXEdge AIStable DiffusionWASM - 最后活动时间: 2026-01-20
WAAS
Whisper即服务工具,提供GUI界面和带队列管理的API服务。
- Stars: ⭐️ 2.1k
- Tags:
whisperapiguispeech-to-textservice - 最后活动时间: 2026-04-17
mcphub
MCP服务器统一管理平台,支持多服务器动态编排、灵活路由策略和端点分发。
- Stars: ⭐️ 2.0k
- Tags:
mcpmcp-gatewaymcp-routerorchestration - 最后活动时间: 2026-04-16
octopus
个人LLM API聚合服务,统一接入多种大语言模型。
- Stars: ⭐️ 2.0k
- Tags:
aiai-gatewayanthropicclaudeopenai - 最后活动时间: 2026-04-09
spikingjelly
基于PyTorch的开源脉冲神经网络(SNN)深度学习框架,支持神经形态计算。
- Stars: ⭐️ 2.0k
- Tags:
脉冲神经网络PyTorch深度学习框架 - 最后活动时间: 2026-04-17
diffrax
基于JAX的可微分数值微分方程求解器,支持GPU加速与自动微分。
- Stars: ⭐️ 2.0k
- Tags:
jaxdifferential-equationsneural-differential-equations - 最后活动时间: 2026-04-05
iris.c
FLUX.2图像生成模型的纯C语言推理实现,轻量高效。
- Stars: ⭐️ 1.9k
- Tags:
fluxinferencec-languageimage-generation - 最后活动时间: 2026-02-13
opacus
PyTorch差分隐私训练库,支持在保护数据隐私的前提下训练深度学习模型。
- Stars: ⭐️ 1.9k
- Tags:
differential-privacypytorchprivacy-preserving-ml - 最后活动时间: 2026-04-10
deepmd-kit
基于深度学习的分子动力学模拟框架,用于多体势能表示和材料科学计算,支持多种深度学习框架后端。
- Stars: ⭐️ 1.9k
- Tags:
Deep LearningMolecular DynamicsComputational Chemistry - 最后活动时间: 2026-04-17
petastorm
支持从Parquet格式数据集进行单机或分布式深度学习模型训练的库。
- Stars: ⭐️ 1.9k
- Tags:
parquetdeep-learningtensorflowpytorch - 最后活动时间: 2026-01-02
flexflow-train
自动发现分布式深度神经网络训练的快速并行化策略,优化大规模模型训练效率。
- Stars: ⭐️ 1.9k
- Tags:
distributed-trainingdeep-learningparallelizationneural-network - 最后活动时间: 2026-04-15
aioway
基于RDBMS理念的深度学习框架,支持声明式、可解释、可扩展的模型部署。
- Stars: ⭐️ 1.8k
- Tags:
deep-learningpytorchscalable - 最后活动时间: 2026-04-17
rocketride-server
高性能AI流水线引擎,采用C++核心与50+可扩展节点,支持多模型提供商和向量数据库的LLM工作流构建。
- Stars: ⭐️ 1.8k
- Tags:
PipelineAgentLLMC++ - 最后活动时间: 2026-04-18
torch-mlir
连接PyTorch生态与MLIR生态的编译器基础设施,优化模型部署流程。
- Stars: ⭐️ 1.8k
- Tags:
pytorchmlircompilermodel-deployment - 最后活动时间: 2026-04-17
nndeploy
简单易用且高性能的 AI 部署框架,支持 TensorRT、ONNXRuntime、OpenVINO 等多种推理后端和低代码工作流编排。
- Stars: ⭐️ 1.8k
- Tags:
部署框架TensorRT多后端LLM - 最后活动时间: 2026-04-12
TensorRT-YOLO
NVIDIA TensorRT加速的YOLO模型部署工具包,支持多版本YOLO模型的高效推理部署。
- Stars: ⭐️ 1.8k
- Tags:
tensorrtyoloobject-detectioninference - 最后活动时间: 2026-03-22
gollama
Go语言编写的Ollama模型管理工具,支持模型查看、删除等操作。
- Stars: ⭐️ 1.8k
- Tags:
ollamallmgguftui - 最后活动时间: 2025-12-30
dreamfactory
企业级API平台,提供安全的数据访问接口,支持本地部署LLM的API连接与角色权限管理。
- Stars: ⭐️ 1.8k
- Tags:
apirestopenapilaravel - 最后活动时间: 2026-04-14
toolhive
企业级MCP服务器运行管理平台,专注于AI安全与基础设施部署,支持Kubernetes环境。
- Stars: ⭐️ 1.7k
- Tags:
MCPAI SecurityKubernetes - 最后活动时间: 2026-04-18
aphrodite-engine
大规模LLM推理引擎,支持CUDA、TPU、ROCm等多种硬件加速和推测解码。
- Stars: ⭐️ 1.7k
- Tags:
inference-enginellmcudatpuloraspeculative-decoding - 最后活动时间: 2026-03-12
LLMRouter
开源LLM路由库,智能分配请求到最适合的模型,优化成本与性能平衡。
- Stars: ⭐️ 1.7k
- Tags:
llmroutingmodel-selectionoptimization - 最后活动时间: 2026-03-17
OpenMLDB
面向机器学习的特征工程数据库,提供训练推理一致性特征计算。
- Stars: ⭐️ 1.7k
- Tags:
feature-storemachine-learning-databasemlopsfeature-engineering - 最后活动时间: 2026-04-14
katib
Kubernetes上的自动化机器学习平台,支持超参数调优和神经架构搜索,适用于大规模ML部署。
- Stars: ⭐️ 1.7k
- Tags:
AutoMLKubernetesMLOps - 最后活动时间: 2026-04-14
mlrun
开源MLOps平台,用于快速构建和管理ML应用全生命周期,支持自动化ML流水线、模型服务和CI/CD集成。
- Stars: ⭐️ 1.7k
- Tags:
MLOpsKubernetesModel-Serving - 最后活动时间: 2026-04-17
APIPark
云原生高性能AI网关平台,统一管理OpenAI、Claude、DeepSeek等主流大模型API,提供负载均衡和灾备功能。
- Stars: ⭐️ 1.7k
- Tags:
AI GatewayLLM GatewayAPI Management - 最后活动时间: 2025-10-26
beta9
超快速无服务器GPU推理平台,专为AI/ML工作负载设计,支持自动扩缩容。
- Stars: ⭐️ 1.6k
- Tags:
ServerlessGPULLM推理 - 最后活动时间: 2026-03-25
LlamaEdge
在本地或边缘设备上运行定制化和微调LLM的最快方式,支持Wasm运行时。
- Stars: ⭐️ 1.6k
- Tags:
llmedge-computingwasmmodel-serving - 最后活动时间: 2026-02-08
BiSeNet
双向分割网络实现,支持TensorRT、NCNN等多种推理框架部署。
- Stars: ⭐️ 1.6k
- Tags:
semantic-segmentationpytorchtensorrtonnx - 最后活动时间: 2026-04-04
PaddleSlim
飞桨深度学习模型压缩与架构搜索库,支持剪枝、量化、蒸馏、NAS等多种模型优化技术。
- Stars: ⭐️ 1.6k
- Tags:
model-compressionquantizationpruningnas - 最后活动时间: 2026-01-04
graalpython
高性能可嵌入的Python 3运行时,专为Java环境设计,支持在Java应用中运行Python AI/ML模型。
- Stars: ⭐️ 1.6k
- Tags:
graalvmpythonjavaembeddable - 最后活动时间: 2026-04-17
CompressAI
端到端压缩研究平台,提供PyTorch库和评估工具。
- Stars: ⭐️ 1.6k
- Tags:
compressiondeep-learningpytorch - 最后活动时间: 2026-03-31
inference
MLPerf推理基准参考实现,提供机器学习模型推理性能的标准化评测。
- Stars: ⭐️ 1.6k
- Tags:
mlperfinferencebenchmarkmachine-learning - 最后活动时间: 2026-04-14
uzu
高性能AI模型推理引擎,使用Rust编写,支持Metal加速。
- Stars: ⭐️ 1.5k
- Tags:
InferenceRustHigh-Performance - 最后活动时间: 2026-04-19
mleap
ML管道生产部署工具,支持将Spark和scikit-learn模型导出为可移植格式,实现跨平台推理。
- Stars: ⭐️ 1.5k
- Tags:
model-deploymentsparkproduction - 最后活动时间: 2026-03-10
ai-gateway
基于Envoy Gateway构建的AI网关,统一管理生成式AI服务访问,支持多LLM提供商接入。
- Stars: ⭐️ 1.5k
- Tags:
AI GatewayEnvoyLLM - 最后活动时间: 2026-04-17
paddler
开源LLM负载均衡和服务平台,支持CPU/GPU自托管大规模部署,基于ggml生态构建,部署简单。
- Stars: ⭐️ 1.5k
- Tags:
负载均衡LLM部署自托管 - 最后活动时间: 2026-04-17
tensorstore
用于高效读写大型多维数组的库,专为机器学习和科学计算场景优化,支持大规模张量数据存储。
- Stars: ⭐️ 1.5k
- Tags:
tensorstoragemachine-learningdata-structuresnumpy - 最后活动时间: 2026-04-14
Genie-TTS
GPT-SoVITS ONNX推理引擎与模型转换器,支持高效语音合成模型部署。
- Stars: ⭐️ 1.5k
- Tags:
ttsonnxvoice-cloninggpt-sovits - 最后活动时间: 2026-04-18
streaming
高效神经网络训练的数据流库,支持大规模数据集流式处理。
- Stars: ⭐️ 1.5k
- Tags:
streamingdeep-learningpytorchdataset - 最后活动时间: 2026-02-02
inference-network
去中心化AI推理验证平台,提供无需信任的AI模型输出验证机制,确保AI推理结果的可信度。
- Stars: ⭐️ 1.5k
- Tags:
ai-verificationinferencetrustlessblockchain - 最后活动时间: 2025-12-11
geomstats
流形几何结构上的计算与统计库,支持黎曼几何深度学习应用。
- Stars: ⭐️ 1.5k
- Tags:
riemannian-geometrymanifolddeep-learningmachine-learningstatistics - 最后活动时间: 2026-04-01
mmengine
OpenMMLab 深度学习模型训练基础库,提供统一的训练框架。
- Stars: ⭐️ 1.5k
- Tags:
aideep-learningpytorchcomputer-vision - 最后活动时间: 2025-12-23
AMD-SHARK-Studio
基于SHARK+IREE的高性能机器学习部署Web UI,支持AMD/Apple/NVIDIA多平台。
- Stars: ⭐️ 1.5k
- Tags:
ml-deploymentireemlircross-platform - 最后活动时间: 2025-12-15
kubernetes-mcp-server
为 Kubernetes 和 OpenShift 提供的 MCP 服务器,让 AI Agent 能够管理容器编排。
- Stars: ⭐️ 1.5k
- Tags:
mcpmcp-serverkubernetesopenshiftcontainers - 最后活动时间: 2026-04-17
bittensor
去中心化机器学习网络,构建互联网规模的神经网络基础设施,支持P2P协作训练。
- Stars: ⭐️ 1.4k
- Tags:
decentralized-aimachine-learningneural-networksblockchainp2p - 最后活动时间: 2026-04-17
concrete-ml
隐私保护机器学习框架,基于全同态加密技术,支持在加密数据上进行模型推理。
- Stars: ⭐️ 1.4k
- Tags:
machine-learningprivacyhomomorphic-encryptionscikit-learn - 最后活动时间: 2026-02-17
react-native-executorch
基于ExecuTorch的React Native端侧AI推理框架,支持LLM、OCR、语音等多种模型。
- Stars: ⭐️ 1.4k
- Tags:
executorchreact-nativeon-device-aillm-inferenceocr - 最后活动时间: 2026-04-17
headroom
LLM应用上下文优化层,通过智能压缩技术解决上下文窗口限制,支持OpenAI、Anthropic等多种提供商。
- Stars: ⭐️ 1.4k
- Tags:
Context OptimizationToken CompressionLLM Proxy - 最后活动时间: 2026-04-18
mlops-python-package
一个全面的MLOps Python项目模板,帮助快速启动和标准化机器学习运维流程与数据管道。
- Stars: ⭐️ 1.4k
- Tags:
MLOpsPythonMLflowTemplate - 最后活动时间: 2026-01-25
sail
LakeSail推出的统一计算框架,将批处理、流处理和AI计算密集型工作负载整合在一起,基于Rust和Apache Arrow构建。
- Stars: ⭐️ 1.4k
- Tags:
artificial-intelligencemachine-learningdata-engineeringdistributed-computing - 最后活动时间: 2026-04-18
ollama-docker
简化Ollama部署的Docker Compose配置,轻松在容器化环境中运行大语言模型。
- Stars: ⭐️ 1.4k
- Tags:
ollamadockerllmlocal-ai - 最后活动时间: 2026-02-11
PaddleSharp
百度Paddle推理库和PaddleOCR的.NET/C#绑定,支持跨平台AI推理。
- Stars: ⭐️ 1.4k
- Tags:
paddlepaddleocrdotnetinference - 最后活动时间: 2026-01-23
mcp-server-kubernetes
MCP服务器,让AI助手能够管理和操作Kubernetes集群,实现智能化的容器编排与运维。
- Stars: ⭐️ 1.4k
- Tags:
KubernetesMCPDevOps - 最后活动时间: 2026-04-07
gomlx
Go语言加速机器学习框架,支持高性能ML模型训练与推理。
- Stars: ⭐️ 1.4k
- Tags:
gogolangmachine-learningxla - 最后活动时间: 2026-04-18
OmDet
实时准确的开放词汇端到端目标检测模型,支持零样本检测与视觉语言理解。
- Stars: ⭐️ 1.4k
- Tags:
object-detectionopen-vocabularyzero-shotvision-language - 最后活动时间: 2026-03-12
agentapi
为 Claude Code、Goose、Aider、Gemini、Amp、Codex 提供统一的 HTTP API 接口。
- Stars: ⭐️ 1.4k
- Tags:
apiclaude-codecodexgeminiaider - 最后活动时间: 2026-04-13
mcp-gateway
Docker MCP CLI插件和网关,用于连接AI模型与外部工具和数据源的Model Context Protocol协议实现。
- Stars: ⭐️ 1.4k
- Tags:
mcpdockerai-gatewaymodel-context-protocol - 最后活动时间: 2026-04-15
kitops
CNCF开源DevOps工具,用于打包和版本管理AI/ML模型、数据集和代码。支持OCI标准,便于Kubernetes部署。
- Stars: ⭐️ 1.3k
- Tags:
mlopsmodel-servingkubernetesdevops - 最后活动时间: 2026-04-18
AQLM
大语言模型极限压缩的官方PyTorch实现,支持加性量化压缩技术。
- Stars: ⭐️ 1.3k
- Tags:
llmcompressionquantizationpytorch - 最后活动时间: 2026-02-26
keras-core
Keras API的多后端实现,支持TensorFlow、JAX和PyTorch三大框架,提供统一的深度学习开发体验。
- Stars: ⭐️ 1.3k
- Tags:
kerasdeep-learningtensorflowpytorchjax - 最后活动时间: 2026-03-10
parallax
分布式模型服务框架,支持在任何环境构建AI推理集群。
- Stars: ⭐️ 1.2k
- Tags:
distributed-inferencellm-servingmodel-serving - 最后活动时间: 2026-04-12
xllm
高性能LLM推理引擎,针对多种AI加速器优化,支持DeepSeek、GLM、Qwen等主流大模型的高效部署。
- Stars: ⭐️ 1.2k
- Tags:
InferenceLLMAccelerator - 最后活动时间: 2026-04-17
gemini-business2api
将 Gemini Business 转换为 OpenAI 兼容接口,支持多账户负载均衡及图像、视频生成等多模态能力。
- Stars: ⭐️ 1.2k
- Tags:
geminiopenaiapi-proxyload-balancingmultimodal - 最后活动时间: 2026-04-15
uni-api
统一管理多个LLM API提供商的网关服务,支持OpenAI、Claude、Gemini等后端,提供统一接口和负载均衡。
- Stars: ⭐️ 1.2k
- Tags:
API网关负载均衡OpenAI兼容 - 最后活动时间: 2026-04-18
MInference
NeurIPS'24 Spotlight,通过动态稀疏注意力计算将长上下文LLM推理延迟降低10倍。
- Stars: ⭐️ 1.2k
- Tags:
inference-optimizationlong-contextsparse-attentionllm - 最后活动时间: 2026-04-08
dlpack
通用内存张量结构标准,实现深度学习框架间零拷贝数据交换。
- Stars: ⭐️ 1.2k
- Tags:
tensordeep-learninginteroperabilitymemory - 最后活动时间: 2026-01-26
csghub-server
CSGHub后端服务,支持数据集和模型管理、模型推理、微调及应用空间运行。
- Stars: ⭐️ 1.2k
- Tags:
模型管理推理服务平台 - 最后活动时间: 2026-04-17
ezkl
一个用于深度学习模型和计算图的零知识证明推理引擎(ZKML),支持Python、JavaScript和命令行调用。
- Stars: ⭐️ 1.2k
- Tags:
aicryptographyzero-knowledgezkml - 最后活动时间: 2026-02-20
langtrace
基于OpenTelemetry的LLM应用可观测性工具,提供实时追踪、评估和监控功能,支持LangChain、OpenAI等主流框架。
- Stars: ⭐️ 1.2k
- Tags:
ObservabilityOpenTelemetryLLMOps - 最后活动时间: 2025-11-17
tabbyAPI
Exllama官方API服务器,兼容OpenAI接口格式,轻量高效,适合本地LLM推理部署。
- Stars: ⭐️ 1.2k
- Tags:
llm-servingopenai-compatibleexllamaapi-server - 最后活动时间: 2026-04-18
kubeai
Kubernetes AI 推理运算符,支持 VLM、LLM、Embedding 和语音识别模型的生产级部署。
- Stars: ⭐️ 1.2k
- Tags:
KubernetesInferenceLLM - 最后活动时间: 2026-03-31
kubetorch
在Kubernetes上分布式运行AI工作负载的Python工具,像PyTorch一样简单管理ML基础设施。支持训练、推理和数据处理的无缝部署。
- Stars: ⭐️ 1.2k
- Tags:
KubernetesPyTorchDistributed AIML Infrastructure - 最后活动时间: 2026-04-13
pruna
模型优化框架,帮助开发者构建更快、更高效的AI模型,支持视觉、语言和语音模型。
- Stars: ⭐️ 1.2k
- Tags:
model-optimizationdeep-learningllmcomputer-visionspeech - 最后活动时间: 2026-04-17
onnxmltools
将机器学习模型转换为ONNX格式的工具集,支持Keras、scikit-learn等框架。
- Stars: ⭐️ 1.1k
- Tags:
onnxmodel-conversioninteroperabilitymachine-learning - 最后活动时间: 2026-04-01
cache-dit
PyTorch原生DiT推理引擎,支持混合缓存加速和大规模并行。专为扩散Transformer优化。
- Stars: ⭐️ 1.1k
- Tags:
diffusion-transformerinference-enginecacheoptimization - 最后活动时间: 2026-04-18
truss
最简单的AI/ML模型生产部署工具。支持Stable Diffusion、Whisper等多种模型,一键打包部署到云端。
- Stars: ⭐️ 1.1k
- Tags:
model-servinginference-servermachine-learning - 最后活动时间: 2026-04-17
index-tts-vllm
为IndexTTS添加vLLM支持,实现更快速的TTS推理。
- Stars: ⭐️ 1.1k
- Tags:
vllmttsinference-optimizationtext-to-speech - 最后活动时间: 2026-04-13
search-and-learn
扩展开源模型推理时计算的资源配方。优化LLM推理性能与资源利用。
- Stars: ⭐️ 1.1k
- Tags:
llminferencecompute-optimization - 最后活动时间: 2026-04-02
clewdr
高性能LLM反向代理服务,支持多模型负载均衡。
- Stars: ⭐️ 1.1k
- Tags:
llmproxyhigh-performanceinfrastructure - 最后活动时间: 2026-04-07
frugally-deep
轻量级仅头文件C++库,用于在C++中推理Keras/TensorFlow模型,适合边缘部署。
- Stars: ⭐️ 1.1k
- Tags:
kerastensorflowcppmodel-inferenceedge-computing - 最后活动时间: 2026-03-13
GPTQModel
LLM模型量化工具包,支持NVIDIA/AMD/Intel多硬件加速,集成vLLM和SGLang推理框架。
- Stars: ⭐️ 1.1k
- Tags:
quantizationllmvllminference - 最后活动时间: 2026-04-19
llmgateway
统一管理多个LLM提供商API请求的网关,提供智能路由、速率限制、成本分析和安全防护功能。
- Stars: ⭐️ 1.1k
- Tags:
API网关多提供商企业级 - 最后活动时间: 2026-04-18
turboquant
面向LLM推理的近最优KV缓存量化方案,支持3-bit键和2-bit值量化,集成Triton内核与vLLM。
- Stars: ⭐️ 1.1k
- Tags:
llmquantizationkv-cacheinferencetritonvllm - 最后活动时间: 2026-03-27
rtp-llm
阿里巴巴开源的高性能大语言模型推理引擎,专为多样化应用场景优化,提供卓越的推理性能。
- Stars: ⭐️ 1.1k
- Tags:
LLM推理引擎阿里巴巴 - 最后活动时间: 2026-04-18
spark-vllm-docker
双DGX Spark环境下的VLLM推理引擎Docker配置,专为高性能大模型推理部署优化。
- Stars: ⭐️ 1.1k
- Tags:
vllmllm-inferencedockergpu - 最后活动时间: 2026-04-18
awesome-mojo
Mojo编程语言的精选资源列表,Mojo是专为AI开发设计的高性能编程语言,兼容Python生态。
- Stars: ⭐️ 1.1k
- Tags:
mojoaiprogramming-languagepython-compatible - 最后活动时间: 2026-04-01
mlops-zero-to-hero
从零到精通的MLOps课程笔记,涵盖机器学习运维全流程实践。
- Stars: ⭐️ 1.1k
- Tags:
mlopsmachine-learningdevopsudemy - 最后活动时间: 2026-01-18
fizz-gateway-node
大模型API聚合网关,支持API集成、脱敏、安全与溯源,为企业级AI应用提供统一的模型调用管理。
- Stars: ⭐️ 1.1k
- Tags:
api-gatewayllmai-gatewaysecurity - 最后活动时间: 2025-12-17
OpenTrit-CHN
开源跨框架混合三值化工具包,支持PyTorch与TensorFlow模型一键转换,封装异构算力调度与量化优化。
- Stars: ⭐️ 1.0k
- Tags:
quantizationpytorchtensorflowmodel-compression - 最后活动时间: 2026-03-01
kvpress
简化LLM KV缓存压缩,支持长上下文推理优化。
- Stars: ⭐️ 1.0k
- Tags:
kv-cachecompressionllmlong-context - 最后活动时间: 2026-04-14
wllama
llama.cpp的WebAssembly绑定,实现浏览器端LLM推理能力。
- Stars: ⭐️ 1.0k
- Tags:
wasmwebassemblyllmbrowser-inference - 最后活动时间: 2025-12-17
optimum-quanto
PyTorch 模型量化后端,支持高效模型部署和推理优化。
- Stars: ⭐️ 1.0k
- Tags:
quantizationpytorchmodel-optimizationinference - 最后活动时间: 2026-04-02
TorchBench
PyTorch官方性能评估基准测试集合,用于评估和优化PyTorch模型性能。
- Stars: ⭐️ 1.0k
- Tags:
pytorchbenchmarkperformance - 最后活动时间: 2026-04-17
guidellm
LLM部署评估工具,帮助优化大模型在实际推理场景中的性能表现。
- Stars: ⭐️ 1.0k
- Tags:
LLM EvaluationDeploymentInference - 最后活动时间: 2026-04-17
monarch
PyTorch单控制器架构,用于分布式训练和模型并行计算。
- Stars: ⭐️ 1.0k
- Tags:
pytorchdistributedmodel-parallelism - 最后活动时间: 2026-04-18
TenSEAL
用于张量同态加密操作的Python库,支持隐私保护机器学习。基于Microsoft SEAL构建,实现加密状态下的深度学习计算。
- Stars: ⭐️ 1.0k
- Tags:
Homomorphic EncryptionPrivacy-Preserving MLTensor Operations - 最后活动时间: 2026-02-27
onnxruntime-genai
ONNX Runtime 的生成式 AI 扩展,提供高效的模型推理与部署能力。
- Stars: ⭐️ 1.0k
- Tags:
onnxgenerative-aimodel-inferenceoptimization - 最后活动时间: 2026-04-18
mongodb-mcp-server
MCP 协议服务器,让 AI Agent 能够连接和操作 MongoDB 数据库及 Atlas 集群。
- Stars: ⭐️ 1.0k
- Tags:
mcpmcp-servermongodbmongodb-atlas - 最后活动时间: 2026-04-18
chronon
专为AI/ML应用设计的数据服务平台,提供高效的数据管道和特征存储能力。
- Stars: ⭐️ 999
- Tags:
mldata-platformfeature-storeai-infrastructure - 最后活动时间: 2026-04-17
ai-hub-models
高通AI Hub提供的SOTA机器学习模型集合,针对高通设备优化延迟和内存,可直接部署。
- Stars: ⭐️ 996
- Tags:
deeplearninginferenceonnxpytorchtensorflow-lite - 最后活动时间: 2026-04-18
litert-torch
支持PyTorch模型转换为LiteRT格式的工具,用于端侧部署优化。
- Stars: ⭐️ 996
- Tags:
pytorchmodel-conversionon-devicetensorflow-lite - 最后活动时间: 2026-04-13
nixl
NVIDIA推理传输库,优化AI模型推理过程中的数据传输性能。
- Stars: ⭐️ 990
- Tags:
nvidiainferencegpu-optimizationtransfer-library - 最后活动时间: 2026-04-18
VoAPI
新一代AI大模型API聚合分发系统,支持多模型统一接口管理,具备高扩展性和高性能。
- Stars: ⭐️ 985
- Tags:
api-gatewayopenaiclaudeai-agentsapi-aggregation - 最后活动时间: 2026-01-27
sparkling-water
将H2O机器学习平台与Apache Spark深度集成,支持在Spark集群中运行H2O算法,实现大规模分布式机器学习。
- Stars: ⭐️ 977
- Tags:
Machine LearningSparkH2OBig Data - 最后活动时间: 2025-11-05
JSTprove
快速、可验证的AI推理框架,基于零知识机器学习(zkML)技术,为AI模型提供可验证的计算证明。
- Stars: ⭐️ 970
- Tags:
zkmlverifiable-aizero-knowledge - 最后活动时间: 2026-04-17
MCPJungle
自托管的MCP网关,为AI代理提供统一的MCP服务器管理和注册服务。
- Stars: ⭐️ 967
- Tags:
MCP网关基础设施 - 最后活动时间: 2026-04-18
bedrock-access-gateway
为Amazon Bedrock提供OpenAI兼容的RESTful API接口,便于开发者无缝迁移和集成AWS大模型服务。
- Stars: ⭐️ 964
- Tags:
AWS BedrockOpenAI CompatibleAPI Gateway - 最后活动时间: 2026-04-15
Nanoflow
面向吞吐量的高性能LLM服务框架。针对CUDA优化,专为大规模语言模型推理设计。
- Stars: ⭐️ 952
- Tags:
llm-servinginferencecudahigh-performance - 最后活动时间: 2026-03-29
ccflare
Claude Code的高性能代理服务,提供API转发与流量管理功能。
- Stars: ⭐️ 948
- Tags:
claude-apiproxyanthropic-apiclaude-code - 最后活动时间: 2026-04-15
onnx2tf
强大的模型转换工具,支持 ONNX 到 TFLite、TensorFlow、PyTorch 等多种格式的相互转换,支持 Core ML 导出。
- Stars: ⭐️ 947
- Tags:
onnxtensorflowpytorchmodel-convertercoreml - 最后活动时间: 2026-04-01
YOLOs-CPP
跨平台生产级C++推理引擎,支持YOLO v5-v12模型,统一API实现目标检测、分割、姿态估计等功能,基于ONNX Runtime优化。
- Stars: ⭐️ 945
- Tags:
yoloinference-engineonnxcppobject-detection - 最后活动时间: 2026-04-13
YOLOs-CPP
跨平台生产级C++推理引擎,支持YOLO v5-v12模型,统一API实现目标检测、分割、姿态估计等功能,基于ONNX Runtime优化。
- Stars: ⭐️ 945
- Tags:
yoloinference-engineonnxcppobject-detection - 最后活动时间: 2026-04-13
checkpoint-engine
用于LLM推理引擎的轻量级中间件,支持动态更新模型权重。
- Stars: ⭐️ 941
- Tags:
llm-inferencecheckpointmodel-servingmiddleware - 最后活动时间: 2026-02-28
zzz-api
稳定的OpenAI、Claude等API代理服务,支持多种AI模型接口调用。
- Stars: ⭐️ 933
- Tags:
api-proxyopenaiclaudegemini - 最后活动时间: 2026-02-02
Fast-dLLM
无需训练即可加速扩散LLM推理的方法,支持KV缓存与并行解码。
- Stars: ⭐️ 932
- Tags:
llminferenceaccelerationkv-cache - 最后活动时间: 2026-04-14
tensorrtllm_backend
NVIDIA Triton推理服务器的TensorRT-LLM后端,提供高性能LLM推理部署能力。
- Stars: ⭐️ 931
- Tags:
tensorrttritonllm-inferencenvidia - 最后活动时间: 2026-04-16
openpcc
可验证隐私AI推理的开源框架。保护数据隐私的同时执行模型推理。
- Stars: ⭐️ 929
- Tags:
privacyinferencesecure-computation - 最后活动时间: 2026-01-08
openinference
专为AI应用设计的OpenTelemetry可观测性工具,支持LangChain、LlamaIndex等主流框架的追踪与监控。
- Stars: ⭐️ 926
- Tags:
ObservabilityOpenTelemetryLLMOps - 最后活动时间: 2026-04-17
transcriptionstream
开箱即用的自托管离线转录服务,支持说话人分离和LLM摘要生成。完全本地化运行,保护隐私数据安全。
- Stars: ⭐️ 926
- Tags:
转录服务说话人分离自托管 - 最后活动时间: 2026-01-18
MCP-Bridge
中间件服务,提供OpenAI兼容接口并支持调用MCP工具。
- Stars: ⭐️ 923
- Tags:
MCPOpenAI中间件 - 最后活动时间: 2025-12-08
Serving
飞桨服务化部署框架,支持高性能模型推理服务部署,提供DAG流水线和微服务架构。
- Stars: ⭐️ 921
- Tags:
model-servingdeep-learningdeploymentpaddle - 最后活动时间: 2026-02-20
NVFlare
NVIDIA开发的联邦学习应用运行环境,支持去中心化的隐私保护机器学习训练和推理。
- Stars: ⭐️ 920
- Tags:
federated-learningprivacydistributed-ml - 最后活动时间: 2026-04-18
compose-for-agents
使用 Docker Compose 构建和运行 AI 智能体,提供开箱即用的编排示例。
- Stars: ⭐️ 918
- Tags:
ai-agentsdockerdocker-composellmself-hosted - 最后活动时间: 2026-03-24
mindnlp
MindSpore与HuggingFace无缝集成库,支持在昇腾平台上运行Transformers和Diffusers模型。
- Stars: ⭐️ 917
- Tags:
mindsporehuggingfacetransformersllmdeep-learning - 最后活动时间: 2026-03-08
sherpa
基于下一代Kaldi的语音识别服务器框架,支持多种端到端ASR模型,提供WebSocket实时接口。
- Stars: ⭐️ 913
- Tags:
ASR实时语音模型部署 - 最后活动时间: 2026-04-19
Paddle2ONNX
飞桨模型转换为ONNX格式的工具,支持分类、检测、OCR等多种模型导出。
- Stars: ⭐️ 913
- Tags:
onnxpaddlepaddlemodel-conversiondeployment - 最后活动时间: 2026-03-18
xmanager
机器学习实验管理平台,支持大规模实验组织和追踪。
- Stars: ⭐️ 905
- Tags:
experiment-managementmachine-learningdeepmind - 最后活动时间: 2026-03-31
AI-Gateway
基于Azure API Management和Microsoft Foundry的AI网关实验室,支持探索AI模型、MCP服务器和智能体开发。
- Stars: ⭐️ 904
- Tags:
AI GatewayMCPAgentsAzure - 最后活动时间: 2026-04-17
ZhiLight
高性能LLM推理加速引擎,针对Llama及其变体模型进行深度优化。
- Stars: ⭐️ 904
- Tags:
InferenceCUDALLM Serving - 最后活动时间: 2026-03-18
oryx
基于Apache Spark和Kafka的Lambda架构框架,支持大规模实时机器学习应用。
- Stars: ⭐️ 904
- Tags:
apache-sparkapache-kafkamachine-learninglambda-architecture - 最后活动时间: 2026-03-27
mosec
高性能ML模型服务框架,支持动态批处理和CPU/GPU流水线。用Rust编写核心,充分利用计算资源。
- Stars: ⭐️ 899
- Tags:
model-servinginferencegpurust - 最后活动时间: 2026-04-16
fal
快速部署开源机器学习模型的高性能推理平台,支持大规模生产环境服务。
- Stars: ⭐️ 890
- Tags:
model-servingml-inferenceproduction-ml - 最后活动时间: 2026-04-17
MLServer
多功能机器学习推理服务器,支持Scikit-learn、XGBoost、LightGBM等多种框架的多模型部署。
- Stars: ⭐️ 884
- Tags:
model-servinginferencemlflowscikit-learnxgboost - 最后活动时间: 2026-04-18
mistral-common
Mistral模型官方推理预处理库。提供标准化的模型输入处理流程。
- Stars: ⭐️ 882
- Tags:
mistralllminferencepreprocessing - 最后活动时间: 2026-04-01
ssd
轻量级推理引擎,支持推测解码(SSD)技术,加速大模型推理过程。
- Stars: ⭐️ 881
- Tags:
inference-enginespeculative-decodingllm - 最后活动时间: 2026-03-22
vllm-mlx
专为 Apple Silicon 优化的推理服务器,支持 LLM 和多模态模型的连续批处理推理,原生 MLX 后端实现高达 400+ tok/s 性能。
- Stars: ⭐️ 878
- Tags:
Apple SiliconMLX推理服务多模态 - 最后活动时间: 2026-04-18
dmlc-core
分布式机器学习核心组件库,为XGBoost等框架提供可扩展的基础设施支持。
- Stars: ⭐️ 877
- Tags:
distributed-mlxgboostscalable - 最后活动时间: 2026-04-13
wassette
安全导向的WebAssembly组件运行时,通过MCP协议支持AI模型部署。
- Stars: ⭐️ 875
- Tags:
mcpwasmwasm-componentwasmtime - 最后活动时间: 2026-03-14
hyper-mcp
快速安全的MCP服务器,支持WebAssembly插件扩展,为AI应用提供灵活架构。
- Stars: ⭐️ 872
- Tags:
MCPWebAssembly插件化 - 最后活动时间: 2026-04-17
relay-pulse
企业级 LLM 中转服务可用性监控系统,实时追踪服务状态并提供可视化仪表板,保障 AI 服务稳定性。
- Stars: ⭐️ 871
- Tags:
LLM监控服务可用性可视化 - 最后活动时间: 2026-04-17
chatllm.cpp
纯C++实现的本地LLM推理框架,支持CPU和GPU实时聊天推理,轻量高效。
- Stars: ⭐️ 865
- Tags:
LLMInferenceC++Local - 最后活动时间: 2026-04-03
model_server
专为OpenVINO优化的可扩展推理服务器。支持边缘和云端部署,提供DAG流水线能力。
- Stars: ⭐️ 858
- Tags:
openvinoinferenceedge-aikubernetes - 最后活动时间: 2026-04-17
openrelay
免费AI模型代理服务,提供数百个免费模型配额,支持一键接入本地项目,兼容多种主流AI工具和IDE。
- Stars: ⭐️ 857
- Tags:
ai-proxyllm-proxymodel-routeropenaiclaude - 最后活动时间: 2026-04-18
onprem
离线环境LLM应用工具包,专为处理敏感数据和受限环境设计,支持本地化部署。
- Stars: ⭐️ 835
- Tags:
llmofflineprivacylocal-deployment - 最后活动时间: 2026-03-24
hpc-ops
高性能LLM推理算子库,优化大模型推理性能。
- Stars: ⭐️ 828
- Tags:
llminferencehigh-performance - 最后活动时间: 2026-04-13
yokai
模块化、可观测的Go后端框架,内置MCP服务器支持,便于构建AI集成应用。
- Stars: ⭐️ 827
- Tags:
gomcpmcp-serverframeworkobservability - 最后活动时间: 2026-02-24
ccNexus
专为Claude Code和Codex CLI设计的智能API网关,支持端点轮换、用量监控,并可无缝集成OpenAI、Gemini等多个AI平台。
- Stars: ⭐️ 825
- Tags:
API GatewayClaude CodeLoad Balancing - 最后活动时间: 2026-04-13
coderunner
为AI代理设计的本地沙箱环境,支持安全隔离的代码执行和容器化运行,保障AI代码执行的安全性。
- Stars: ⭐️ 819
- Tags:
SandboxClaude CodeMCPContainerization - 最后活动时间: 2026-04-14
Stan Math Library
C++模板库,支持任意阶自动微分(前向、反向和混合模式),内置概率建模、线性代数和方程求解函数。
- Stars: ⭐️ 818
- Tags:
Automatic DifferentiationC++Probabilistic Modeling - 最后活动时间: 2026-04-17
llamafarm
一站式AI模型部署平台,支持本地或远程快速部署模型、Agent、RAG和数据库管道。
- Stars: ⭐️ 817
- Tags:
模型部署MLOpsRAG - 最后活动时间: 2026-04-17
mesh-llm
基于llama.cpp的分布式LLM推理参考实现,支持跨机器分布式推理,提供端到端演示。
- Stars: ⭐️ 814
- Tags:
llmdistributed-inferencellama.cpp - 最后活动时间: 2026-04-19
mesh-llm
基于llama.cpp的分布式LLM推理框架,支持跨机器协同推理,提供完整的端到端演示。
- Stars: ⭐️ 814
- Tags:
llmdistributed-inferencellama.cpp - 最后活动时间: 2026-04-19
context-space
上下文工程基础设施平台,提供MCP服务端与客户端的完整解决方案。
- Stars: ⭐️ 810
- Tags:
mcpcontext-engineeringai-agentmodel-context-protocol - 最后活动时间: 2025-10-22
RTNeural
实时神经网络推理引擎,专为低延迟音频处理和嵌入式系统设计。
- Stars: ⭐️ 807
- Tags:
real-time-inferenceneural-networkaudio-processingembedded - 最后活动时间: 2025-11-08
llama3.java
纯Java实现的Llama 3推理引擎,支持SIMD加速,适合Java生态的LLM部署。
- Stars: ⭐️ 805
- Tags:
llmjavallama3inference - 最后活动时间: 2026-04-10
codex-lb
ChatGPT/Codex多账号负载均衡代理工具,支持用量追踪、仪表盘和OpenCode兼容端点。
- Stars: ⭐️ 798
- Tags:
load-balanceropenaichatgptapi-proxydashboard - 最后活动时间: 2026-04-16
nobodywho
支持多平台的本地LLM推理引擎,可在任何设备上高效运行大语言模型,支持Godot游戏引擎和Flutter。
- Stars: ⭐️ 797
- Tags:
InferenceLocal AICross-platform - 最后活动时间: 2026-04-18
neoml
支持深度学习和传统算法的机器学习框架,支持ONNX格式,适合跨平台部署。
- Stars: ⭐️ 797
- Tags:
machine-learningdeep-learningneural-networkonnxcpp - 最后活动时间: 2025-11-26
QPT
一款专注于AI/深度学习项目的Python打包工具,可将Python项目转换为可执行EXE文件,支持CUDA、PaddlePaddle等深度学习框架的无缝打包部署。
- Stars: ⭐️ 795
- Tags:
pythonpackagingdeep-learningcudapaddlepaddle - 最后活动时间: 2026-02-06
darknet
经典开源深度学习框架,YOLO目标检测算法的原始实现,广泛用于实时目标检测应用。
- Stars: ⭐️ 792
- Tags:
yoloobject-detectionneural-networkscomputer-vision - 最后活动时间: 2026-04-13
MagiAttention
面向超长上下文和异构数据训练的分布式注意力机制,实现线性可扩展性。
- Stars: ⭐️ 783
- Tags:
distributed-attentionlong-contexttrainingscalability - 最后活动时间: 2026-04-08
X2Paddle
飞桨深度学习模型转换工具,支持PyTorch、TensorFlow、ONNX等框架模型互转。
- Stars: ⭐️ 774
- Tags:
model-converterpaddlepaddlepytorchtensorflowonnx - 最后活动时间: 2025-10-22
reverb
高效易用的机器学习数据存储和传输系统,专为ML研究设计。
- Stars: ⭐️ 773
- Tags:
data-storagereinforcement-learningtensorflow - 最后活动时间: 2026-04-16
cog-comfyui
将ComfyUI打包为API服务,方便部署和调用Stable Diffusion图像生成工作流。
- Stars: ⭐️ 765
- Tags:
comfyuistable-diffusionapimodel-serving - 最后活动时间: 2025-11-03
comfy-cli
ComfyUI官方命令行管理工具,简化Stable Diffusion工作流的安装、更新与环境配置。
- Stars: ⭐️ 755
- Tags:
ComfyUICLIStable Diffusion - 最后活动时间: 2026-04-15
comfyui-openrouter-ai
一站式ComfyUI工作流和AI模型管理平台,支持负载均衡、可视化表单、用户积分系统和完整管理后台,适合自托管部署。
- Stars: ⭐️ 754
- Tags:
comfyuiai-modelsopenrouter-apiworkflow-management - 最后活动时间: 2025-10-28
stable-diffusion-portable
便携版Stable Diffusion部署方案,无需安装即可快速运行AI图像生成。
- Stars: ⭐️ 748
- Tags:
stable-diffusionportableimage-generation - 最后活动时间: 2026-02-24
llm-server-docs
完整的本地私有LLM服务器部署文档,支持聊天、RAG、MCP、图像生成和TTS等功能。
- Stars: ⭐️ 742
- Tags:
LLM ServerSelf-hostedDocker - 最后活动时间: 2026-03-02
io
TensorFlow SIG-IO维护的数据集、流媒体和文件系统扩展库。
- Stars: ⭐️ 736
- Tags:
tensorflowdatasetstreamingfilesystem - 最后活动时间: 2026-03-11
yolort
YOLOv5跨平台推理运行时,支持TensorRT、ONNXRuntime、TVM等多种加速器部署。
- Stars: ⭐️ 730
- Tags:
yoloinferencetensorrtonnxruntimepytorch - 最后活动时间: 2026-04-10
aperture
现代化工作负载的限流、缓存和请求优先级管理工具,支持LLM和云原生环境。
- Stars: ⭐️ 727
- Tags:
rate-limitercachingkubernetesllmcloud-native - 最后活动时间: 2025-12-21
mcpcan
MCP服务集中管理平台,支持容器化部署、服务监控和令牌验证,解决MCP服务安全与快速部署问题。
- Stars: ⭐️ 718
- Tags:
MCPContainerKubernetesPlatform - 最后活动时间: 2026-04-03
TileRT
基于分块计算的 LLM 推理运行时,实现超低延迟的大语言模型推理服务。
- Stars: ⭐️ 710
- Tags:
llm-inferencelow-latencyruntimeoptimization - 最后活动时间: 2026-03-08
clove
Claude.ai 反向代理服务,帮助开发者更灵活地调用 Claude API 服务。
- Stars: ⭐️ 707
- Tags:
claudereverse-proxyapi - 最后活动时间: 2026-03-28
mlx-omni-server
基于Apple MLX框架的本地推理服务器,提供OpenAI兼容API,专为Apple Silicon优化。
- Stars: ⭐️ 706
- Tags:
mlxlocal-inferenceopenai-apiapple-silicon - 最后活动时间: 2026-03-10
LightCompress
强大的大模型压缩工具包,支持LLM、VLM和视频生成模型的量化、剪枝和Token缩减。已被EMNLP 2024和AAAI 2026收录。
- Stars: ⭐️ 704
- Tags:
Model CompressionQuantizationLLMPruning - 最后活动时间: 2026-04-01
lws
Kubernetes API用于部署LLM推理工作负载,支持Leader-Worker模式的Pod组复制管理。
- Stars: ⭐️ 699
- Tags:
llm-inferencekubernetesmodel-serving - 最后活动时间: 2026-04-15
FfDL
IBM开源的深度学习平台,在Kubernetes上提供TensorFlow、PyTorch、Caffe等框架即服务,支持模型训练与部署。
- Stars: ⭐️ 689
- Tags:
Deep LearningKubernetesModel Serving - 最后活动时间: 2026-01-29
triton-client
NVIDIA Triton推理服务器客户端库,支持Python、C++、Java等多语言模型部署与调用。
- Stars: ⭐️ 687
- Tags:
tritoninference-servermodel-servinggrpc - 最后活动时间: 2026-04-18
kale
Kubeflow流水线的数据科学工具包,简化机器学习工作流的部署与管理。
- Stars: ⭐️ 683
- Tags:
kubeflowkubeflow-pipelinesmachine-learning - 最后活动时间: 2026-04-16
mcp-proxy
MCP代理服务器,通过单一HTTP端点聚合和提供多个MCP资源服务。
- Stars: ⭐️ 681
- Tags:
mcpmcp-serverclaudemodelcontextprotocol - 最后活动时间: 2026-02-19
ml-metadata
ML工作流元数据记录与检索工具,帮助管理机器学习开发流程。
- Stars: ⭐️ 676
- Tags:
ml-metadataml-pipelineworkflow - 最后活动时间: 2026-02-12
catwalk
LLM推理提供商和模型的集合工具,支持多种推理后端和模型格式,便于快速切换和部署。
- Stars: ⭐️ 675
- Tags:
LLM InferenceModel Serving - 最后活动时间: 2026-04-18
ServerlessLLM
面向所有人的无服务器LLM服务框架。支持HuggingFace模型,降低大模型部署门槛。
- Stars: ⭐️ 674
- Tags:
serverlessllm-servinghuggingfacemodel-serving - 最后活动时间: 2026-03-06
zerogravity
兼容OpenAI、Anthropic和Gemini的代理服务,模拟真实Antigravity流量访问Google服务。
- Stars: ⭐️ 671
- Tags:
OpenAIAnthropicGeminiProxy - 最后活动时间: 2026-04-16
timber
经典ML模型的AOT编译器,将XGBoost、LightGBM等模型编译为C99推理代码,比Python快336倍。
- Stars: ⭐️ 668
- Tags:
Model ServingCompilerInference - 最后活动时间: 2026-04-16
MinivLLM
轻量级vLLM复现实现,包含自包含的分页注意力和Flash Attention核心组件。
- Stars: ⭐️ 665
- Tags:
vllminferencepaged-attentionflash-attention - 最后活动时间: 2026-03-16
long-context-attention
统一序列并行注意力机制USP,支持长上下文Transformer模型的训练与推理。
- Stars: ⭐️ 663
- Tags:
ring-attentionsequence-parallelllm-trainingllm-inference - 最后活动时间: 2026-01-15
ITensors.jl
Julia语言的高效张量计算与张量网络库,广泛应用于机器学习、量子计算和物理模拟领域。
- Stars: ⭐️ 662
- Tags:
tensor-computationstensor-networksjuliamachine-learning - 最后活动时间: 2026-04-18
OpenTinker
RL-as-a-Service基础设施平台,专为基础模型提供强化学习服务能力。
- Stars: ⭐️ 661
- Tags:
RLInfrastructureFoundation Models - 最后活动时间: 2026-03-21
ai-dial-core
AI DIAL核心组件,提供统一的API接口访问多种聊天模型、嵌入模型和AI助手。
- Stars: ⭐️ 655
- Tags:
Model GatewayAPI ProxyLLM Serving - 最后活动时间: 2026-04-17
ck
社区驱动的AI/ML自动化与基准测试平台,基于MLPerf方法论帮助优化AI工作负载在不同硬件和软件环境中的性能。
- Stars: ⭐️ 646
- Tags:
mlperfmlopsbenchmarkingautomationai-optimization - 最后活动时间: 2026-03-12
mlops-coding-course
MLOps实战课程,教授如何构建、开发与维护企业级机器学习运维代码库。
- Stars: ⭐️ 646
- Tags:
mlopsmachine-learningdevopsbest-practices - 最后活动时间: 2026-01-25
gateway-api-inference-extension
Kubernetes Gateway API的推理扩展,为AI模型推理提供标准化的流量管理和路由能力。
- Stars: ⭐️ 645
- Tags:
KubernetesInferenceAPI Gateway - 最后活动时间: 2026-04-18
MCP
Jina AI官方远程MCP服务器,为AI应用提供模型上下文协议支持。
- Stars: ⭐️ 645
- Tags:
mcpmcp-serverjina-ai - 最后活动时间: 2026-03-14
stablehlo
向后兼容的ML计算算子集,受HLO/MHLO启发,用于跨框架模型移植。
- Stars: ⭐️ 643
- Tags:
ml-compilerportable-mlhlo - 最后活动时间: 2026-04-13
candle-vllm
高效的本地LLM推理和服务平台,提供OpenAI兼容的API服务器。
- Stars: ⭐️ 642
- Tags:
inferencellmapi-server - 最后活动时间: 2026-04-18
nest-simulator
脉冲神经网络模拟器,用于计算神经科学和类脑计算研究,支持大规模神经元网络仿真。
- Stars: ⭐️ 642
- Tags:
neurosciencespiking-neural-networkssimulation - 最后活动时间: 2026-04-17
backend.ai
一个流线型的容器化计算集群平台,支持主流ML框架和多种编程语言,提供CUDA GPU、TPU、NPU等异构加速器支持。
- Stars: ⭐️ 629
- Tags:
ML InfrastructureGPU ComputingContainer Platform - 最后活动时间: 2026-04-18
ollama_proxy_server
Ollama多实例代理服务器,提供API密钥安全管理、智能负载均衡和用户权限管理,适合团队协作部署。
- Stars: ⭐️ 619
- Tags:
OllamaProxyLoad Balancer - 最后活动时间: 2026-04-18
lollms_hub
多实例Ollama代理服务器,提供API网关、负载均衡、速率限制和密钥安全管理功能。
- Stars: ⭐️ 619
- Tags:
ollamaapi-gatewayload-balancerproxyllm-serving - 最后活动时间: 2026-04-18
Neuraxle
简洁的AutoML库,提供清晰的深度学习生产管道抽象。支持超参数调优,兼容Scikit-Learn和TensorFlow。
- Stars: ⭐️ 614
- Tags:
automlpipelinehyperparameter-tuningmachine-learning - 最后活动时间: 2026-02-20
icechunk
云原生事务性张量存储引擎,专为AI/ML工作负载设计,支持xarray和Zarr格式的高效数据管理。
- Stars: ⭐️ 613
- Tags:
tensor-storagexarrayzarrcloud-native - 最后活动时间: 2026-04-16
ejml
高性能Java线性代数库,支持密集矩阵、稀疏矩阵、实数和复数矩阵运算,是机器学习和AI开发的基础数学库。
- Stars: ⭐️ 612
- Tags:
linear-algebramatrixmachine-learningjava - 最后活动时间: 2026-04-19
SINQ
新型快速高质量量化方法,可在保持精度的同时压缩大语言模型。
- Stars: ⭐️ 611
- Tags:
quantizationllm-compressionmodel-optimization - 最后活动时间: 2026-02-23
ai00_server
一体化 RWKV 运行时服务,集成嵌入、RAG、AI 智能体等功能,兼容 OpenAI API。
- Stars: ⭐️ 610
- Tags:
rwkvllmragopenai-apiaiagents - 最后活动时间: 2026-02-22
Gemini-FastAPI
将 Gemini 模型封装为 OpenAI 兼容的 API 接口,方便开发者无缝切换使用。
- Stars: ⭐️ 607
- Tags:
fastapigeminiopenai-apiapi-wrapper - 最后活动时间: 2026-04-13
fastapi-ml-skeleton
FastAPI机器学习模型服务骨架应用,快速构建生产级ML API服务。
- Stars: ⭐️ 604
- Tags:
fastapimodel-servingproduction-ml - 最后活动时间: 2026-01-08
llms
LLM客户端、服务器API和UI工具集,提供完整的模型服务解决方案。
- Stars: ⭐️ 603
- Tags:
LLMAPIServer - 最后活动时间: 2026-04-18
dlstreamer
Intel开源的深度学习流媒体分析框架,基于GStreamer构建云端和边缘媒体分析管道。
- Stars: ⭐️ 600
- Tags:
deep-learninggstreamerinferenceopenvinoedge-ai - 最后活动时间: 2026-04-17
informers
Ruby语言的高性能Transformer推理库,支持命名实体识别、问答和情感分析任务。
- Stars: ⭐️ 600
- Tags:
rubytransformer-inferencenlp - 最后活动时间: 2026-04-15
hugot
Golang语言的ONNX Transformer推理管道,支持在Go环境中运行NLP模型。
- Stars: ⭐️ 593
- Tags:
golangonnxtransformer-inference - 最后活动时间: 2026-04-18
mcp-gateway
MCP服务器的反向代理和管理层,支持Kubernetes环境下的可扩展、会话感知的状态路由和生命周期管理。
- Stars: ⭐️ 589
- Tags:
MCPLLM InfrastructureKubernetes - 最后活动时间: 2026-04-16
openscoring
RESTful Web服务,用于Scikit-Learn、R和Apache Spark模型的实时推理评分(延迟<1ms),支持PMML格式模型部署。
- Stars: ⭐️ 589
- Tags:
machine-learningmodel-servingpmmlscikit-learnreal-time-inference - 最后活动时间: 2026-02-02
ai-gateway
快速、轻量的开源AI网关,提供负载均衡、缓存、限流和可观测性功能。
- Stars: ⭐️ 573
- Tags:
ai-gatewayllmload-balancingrate-limitingobservability - 最后活动时间: 2025-11-21
optimistix
基于JAX+Equinox的非线性优化库,支持根查找、最小二乘等优化任务。
- Stars: ⭐️ 570
- Tags:
optimizationjaxdeep-learningequinox - 最后活动时间: 2026-04-13
casbin-gateway
专为AI和MCP服务设计的安全网关,支持HTTP代理和OAuth认证,为LLM应用提供企业级安全防护。
- Stars: ⭐️ 557
- Tags:
AI SecurityLLM GatewayMCPProxy - 最后活动时间: 2026-04-17
ai.deploy.box
深度学习模型部署工具箱,支持 C++ 部署 Yolo、GAN、OCR、StableDiffusion 等多种模型。支持 ONNX、NCNN、WebAssembly 等多平台。
- Stars: ⭐️ 550
- Tags:
model-deploymentyoloonnxncnncppstable-diffusion - 最后活动时间: 2025-10-20
llumnix-ray
高效易用的多实例 LLM 服务框架,支持大规模模型部署与推理调度优化。
- Stars: ⭐️ 546
- Tags:
llm-servinginferenceraymulti-instance - 最后活动时间: 2026-03-12
model-runner
Docker官方推出的模型运行工具,支持在Docker容器中快速部署和运行AI大语言模型,简化本地AI开发流程。
- Stars: ⭐️ 545
- Tags:
dockerllmmodel-servinginference - 最后活动时间: 2026-04-17
jpmml-sklearn
将Scikit-Learn机器学习流水线转换为PMML格式的Java库,便于模型部署与跨平台迁移。
- Stars: ⭐️ 540
- Tags:
pmmlscikit-learnmodel-deploymentmachine-learning - 最后活动时间: 2026-04-05
llama-cpp-rs
llama.cpp 的 Rust 语言绑定,提供高效的本地 LLM 推理能力。
- Stars: ⭐️ 539
- Tags:
llmrustinferencellama-cpp - 最后活动时间: 2026-04-19
lineax
基于JAX和Equinox的线性求解器库,为深度学习提供高效的线性代数运算支持。
- Stars: ⭐️ 539
- Tags:
jaxlinear-algebraequinoxsolver - 最后活动时间: 2026-04-05
Awesome-DiT-Inference
Diffusion Transformer推理优化论文与代码合集,涵盖采样加速、量化、并行计算等核心技术。
- Stars: ⭐️ 538
- Tags:
DiT推理优化量化Diffusion - 最后活动时间: 2026-03-19
KuiperLLama
从零实现的大模型推理框架,支持Llama2/3和Qwen2.5,适合学习推理引擎架构与CUDA加速。
- Stars: ⭐️ 531
- Tags:
inference-enginellmcudacppllama - 最后活动时间: 2025-10-28
traceml
Polyaxon的ML追踪与可视化引擎,支持数据漂移检测、模型可解释性分析和交互式仪表盘。
- Stars: ⭐️ 530
- Tags:
MLOpsVisualizationDrift Detection - 最后活动时间: 2026-04-13
TensorLayerX
跨平台统一深度学习框架,支持PyTorch、TensorFlow、MindSpore等多后端。
- Stars: ⭐️ 528
- Tags:
deep-learningcross-platformpytorchtensorflowpaddlepaddle - 最后活动时间: 2026-01-23
aikit
开源大模型微调、构建和部署的一站式工具,支持Docker和Kubernetes环境下的LLM服务化。
- Stars: ⭐️ 516
- Tags:
LLMDeploymentDocker - 最后活动时间: 2026-04-13
skops
HuggingFace出品的Python库,帮助分享和部署scikit-learn机器学习模型。
- Stars: ⭐️ 513
- Tags:
MLOpsscikit-learnDeployment - 最后活动时间: 2026-04-17
popmon
Pandas和Spark数据框稳定性监控工具,支持数据漂移检测和统计过程控制。
- Stars: ⭐️ 511
- Tags:
Data MonitoringDrift DetectionSpark - 最后活动时间: 2026-01-09
model_analyzer
Triton推理服务器模型分析工具,帮助理解模型的计算和内存需求。
- Stars: ⭐️ 509
- Tags:
inferencegpuperformance-analysisdeep-learning - 最后活动时间: 2026-04-18
FAST
高性能医学图像处理与神经网络推理可视化框架,支持GPU加速和流式处理。
- Stars: ⭐️ 508
- Tags:
Medical ImagingDeep LearningInferenceVisualization - 最后活动时间: 2026-04-09
crater
云原生 AI 训练与推理平台,支持 Kubernetes 部署,集成 PyTorch、TensorFlow、vLLM 等主流框架。
- Stars: ⭐️ 506
- Tags:
kubernetesai-traininginferencepytorchvllmray - 最后活动时间: 2026-04-16
MCPSpy
基于eBPF的MCP协议监控工具,用于AI安全与可观测性分析。
- Stars: ⭐️ 505
- Tags:
mcpmonitoringebpfai-security - 最后活动时间: 2026-01-16
streamlit-fastapi-model-serving
使用Streamlit和FastAPI构建PyTorch模型服务Web应用的示例项目。
- Stars: ⭐️ 503
- Tags:
pytorchfastapistreamlitmodel-servingdocker - 最后活动时间: 2026-03-27
claude-code-mux
高性能Rust构建的AI路由代理,支持15+提供商的自动故障转移和优先级路由。
- Stars: ⭐️ 502
- Tags:
ai-proxyrustmulti-provider - 最后活动时间: 2025-11-19
melior
Rust语言的MLIR绑定库,为机器学习编译器基础设施提供原生支持,适用于构建高性能AI模型优化工具。
- Stars: ⭐️ 502
- Tags:
mlirllvmrustcompiler - 最后活动时间: 2026-04-15
flash-tokenizer
高效优化的LLM推理分词器引擎,基于C++实现,支持BERT和WordPiece分词。
- Stars: ⭐️ 458
- Tags:
TokenizerLLMInference - 最后活动时间: 2026-02-02
SDKs & APIs
Omega-AI
基于Java的深度学习框架,支持自动求导、多线程与GPU运算(CUDA/CUDNN),可快速搭建神经网络。
- Stars: ⭐️ 502
- Tags:
deeplearningneural-networkjavacudaai - 最后活动时间: 2026-04-16
未分类 (Others)
phoenix
开源AI可观测性平台,支持LLM应用追踪、实验评估和性能监控,帮助开发者调试和优化AI系统。
- Stars: ⭐️ 9.3k
- Tags:
LLMOpsObservabilityEvaluation - 最后活动时间: 2026-04-18
sacred
机器学习实验配置、组织、日志记录与复现工具,助力可重复科学研究。
- Stars: ⭐️ 4.4k
- Tags:
machine-learningreproducibilityexperiment-trackingpython - 最后活动时间: 2025-10-22
fann
快速人工神经网络库,用C语言实现的轻量级神经网络框架,适合嵌入式系统和实时应用。
- Stars: ⭐️ 1.7k
- Tags:
neural-networkmachine-learningcembedded - 最后活动时间: 2026-01-28
ml-compiler-opt
LLVM机器学习引导优化基础设施,利用ML技术提升编译器优化效果。
- Stars: ⭐️ 768
- Tags:
llvmcompiler-optimizationmachine-learning - 最后活动时间: 2026-04-08
xprof
专为机器学习设计的性能分析与调优工具,帮助开发者优化ML模型的运行效率和资源利用率。
- Stars: ⭐️ 500
- Tags:
profilingmachine-learningperformance-analysis - 最后活动时间: 2026-04-18
