5热度
11回答
[ggerganov/llama.cpp]Windows XP:支持MinGW 8.1.0
6热度
5回答
[ggerganov/llama.cpp]添加对oai python服务器中函数调用的基本支持
6热度
17回答
[ggerganov/llama.cpp]简单的转换脚本在 Linux 上耗尽了 tmpfs 空间
8热度
5回答
[ggerganov/llama.cpp]iOS swift 包似乎使用了 NEWLAPACK 的内部符号:cblas_sgemm,导致使用此符号的应用程序无法发布到 App Store
6热度
16回答
[ggerganov/llama.cpp][用户] 实现 Streaming LLM - 让推理更高效
6热度
16回答
[ggerganov/llama.cpp]转换:更新 Falcon 脚本以适应新的 HF 配置
9热度
5回答
[ggerganov/llama.cpp][bug] 运行多 GPU 推理时,ROCm 出现段错误。
2热度
5回答
[ggerganov/llama.cpp]即使不处于交互模式,也启用 sigint 处理程序
2热度
13回答
[ggerganov/llama.cpp]通过放宽 constness 来修复 ROCM 构建
2热度
8回答
[ggerganov/llama.cpp]metal:修复 #2268 之后的构建错误和 rope kernel sig
2热度
14回答
[ggerganov/llama.cpp]同步:ggml(后端 v2)
4热度
26回答
[ggerganov/llama.cpp]检查 CUDA 内存池支持
9热度
2回答
[SJTU-IPADS/PowerInfer]通义千问大模型什么时候能支持呢?我们在用72B、14B的,迫切希望能支持加速推理。
4热度
3回答
9热度
3回答
[SJTU-IPADS/PowerInfer]windows visual studio编译失败
2热度
3回答
[SJTU-IPADS/PowerInfer]请问你们是否有兴趣支持deepseek?
1热度
2回答
[SJTU-IPADS/PowerInfer]请问下针对消费级卡的服务器的适配。
0热度
7回答
3热度
2回答
[SJTU-IPADS/PowerInfer]ReluFalcon 40B 在llama.cpp上无效输出
7热度
1回答
[SJTU-IPADS/PowerInfer]关于在A100显卡上测得的效果异常的疑问