[ggerganov/llama.cpp]构建 C 对象 CMakeFiles/ggml.dir/ggml.co 失败

我输入： git clone https://github.com/ggerganov/llama.cpp cd llama.cpp mkdir build cd build cmake .. -DLLAMA_CUBLAS=ON cmake --build 。--config 发布

失败于：[ 2%] 构建 C 对象 CMakeFiles/ggml.dir/ggml.co

错误显示：调用“always_inline”“_mm256_fmadd_ps”时内联失败：目标特定选项不匹配gmake [2]：[CMakeFiles / ggml.dir / build.make：76：CMakeFiles / ggml.dir / ggml.co]错误1 gmake[1]: [CMakeFiles/Makefile2:650: CMakeFiles/ggml.dir/all] 错误 2 gmake: *** [Makefile:146: all] 错误 2

PingEnLu

您在什么平台/系统上运行它？

staviq

在 Windows 10 上的 Ubuntu 22.04 VM 上的可写奇点容器 (NGC PyTorch 23.08) 上运行。

PingEnLu

似乎这可能与没有SSE（或其他）支持有关：https://stackoverflow.com/questions/35772562/inlined-failed-in-call-to-always-inline-m128i-mm-cvtepu8-epi32- m128i-t

既然您说您正在容器中运行它，那么它可能无法正确检测可用的 SIMD 内容。你可以尝试搞乱像这样的选项LLAMA_AVX

KerfuffleV2

同样的问题，我在 Fedora 38 (裸机) / CentOS 7 (vm) / Ubuntu 22.04 (vm)、gcc 11/12、cuda 12.2/12.3 上尝试，均失败。我可以使用 make 构建 cuBLAS 版本，也可以使用 CMake 构建 AVX512 版本，但不知道如何获得同时支持 CUDA 和 AVX512 的版本。

hiarcs

AVX 是您的 CPU 应该具有的东西，是 CPU 指令集扩展，它完全依赖于硬件，或者如果您使用 docker、容器或虚拟机，某些 CPU 扩展可能会被 VM/容器主机阻止。

staviq

我的案例不涉及虚拟机/容器问题，它是一个裸机软呢帽盒。我的目标是，当我在 GPU 和 CPU 之间分配工作负载时，CPU 计算不会花费太长时间（测试表明，在我的场景中启用 AVX 会带来 2.5 倍的加速）。

hiarcs

使用来检查选项cmake，其中有一些专门针对 AVX512 的选项。似乎Makefile只是依赖于 using -march=native -mtune=native（换句话说，让编译器使用所有可用的功能）。对于 cmake，除了 CUDA 选项之外，没有什么可以阻止您设置 AVX 选项。

如果您想专门设置特定的编译器选项，您可以编辑Makefile或可能安排以CFLAGS其他方式添加它们。

但如果编译器没有检测到支持，可能会出现一些奇怪的情况。

KerfuffleV2

[ggerganov/llama.cpp]构建 C 对象 CMakeFiles/ggml.dir/ggml.co 失败

回答