当前位置: 首页 > news >正文

[CUDA] cuda程序编译注意事项

文章目录

  • 1. cuda cmake编译注意
    • 1.1 undefined referece `pthread_once` Error
  • 2. nvcc基本使用

1. cuda cmake编译注意

1.1 undefined referece pthread_once Error

  • 单例模式下, 在.cu文件下出现pthread_once undefine reference的错误;主要是单例中使用std::call_once可能调用了这个pthread_once导致; 最主要的原因是没有找到pthread库,但是不是在target_link_libraries中加上pthread (测试无效);
  • 最终方法:通过find_package(CUDA),找到CUDA_LIBRARIES, 然后将这个cmake变量加到target_link_libraries的前面位置,因为很多其他库是依赖它的(注意顺序)。
target_link_libraries(
${CUDA_LIBRARIES}
...
)

2. nvcc基本使用


nvcc test.cu -arch=sm_80 -o a.out && ./a.out# 如果程序中用到cublas或者pthread则需要添加对应的库link信息
nvcc test.cu -arch=sm_80 -lcublas -pthread -o a.out && ./a.out

http://www.mrgr.cn/news/70668.html

相关文章:

  • SpringBoot(八)使用AES库对字符串进行加密解密
  • RabbitMq项目实战--延迟队列实现超时订单处理
  • 【Linux】网络编程3
  • SpringBoot如何集成WebSocket
  • 【数据结构】图的应用的时间复杂度
  • 基于redis实现API接口访问次数限制
  • 解码潜意识:如何用Python构建梦境分析模型
  • C#入门 020 事件(类型成员)
  • (05/16) - 萨班斯-奥克斯利法案(SOX)--- 详解SOX法案
  • 【uiautomator】自动化测试camera【一】
  • 简述 synchronized 和 java.util.concurrent.locks.Lock 的异同?
  • Scrapy搭配Selenium爬取豆瓣电影250排行榜动态网页数据
  • Linux中线程的基本概念与线程控制
  • 深⼊理解指针(5)[回调函数、qsort相关知识(qsort可用于各种类型变量的排序)】
  • YOLOv11融合CVPR[2020]自校准卷积SCConv模块及相关改进思路|YOLO改进最简教程
  • 前端知识点---字符串的8种拼接方法(Javascript)
  • 边缘检测的100种方法
  • PCL 点云拟合 Ransac拟合空间球体
  • 基于图的去中心化社会推荐过滤器
  • 麒麟服务器工作站SP1 arm环境qt5.6.3源码编译
  • 【大咖云集 | IEEE计算智能学会广州分会支持】第四届信息技术与当代体育国际学术会议(TCS 2024,12月13-15日)
  • 数据库基础(14) . MySQL存储过程
  • 嵌入式学习-C嘎嘎-Day01
  • 基于stm32的智能晾衣杆(开源)
  • uniapp中webview全屏不显示导航栏解决方案
  • 20个Python自动化脚本,提升编程能力