[FEA]: Introduce Python module with CCCL headers #3201

rwgk · 2024-12-19T19:24:52Z

Description

closes #2281

…cooperative

copy-pr-bot · 2024-12-19T19:24:55Z

Auto-sync is disabled for draft pull requests in this repository. Workflows must be run manually.

Contributors can view more details about this message here.

leofang · 2024-12-19T19:47:00Z

python/cuda_cccl/setup.py

+project_path = os.path.abspath(os.path.dirname(__file__))
+cccl_path = os.path.abspath(os.path.join(project_path, "..", ".."))
+cccl_headers = [["cub", "cub"], ["libcudacxx", "include"], ["thrust", "thrust"]]
+ver = "0.1.2.8.0"


I think we need to use the CCCL version here, not CCCL Python modules' version. We should also not hard-code it, but instead read from CMakeLists which is the source of truth AFAIK, and for that setuptools might not be doing the job. @vyasr might have a simple example for how this can be done with scikit-build-core.

Ack. I added this is a bullet to the PR description.

Check out the dynamic metadata section, specifically the Regex tab.

You would need to rewrite everything here to use CMake instead of setuptools. Depending on what this module is trying to do that may or may not be beneficial. Do you need to run compilation of cuda_cccl/cooperative/parallel against CCCL headers? In that case it is almost certainly worthwhile, I wouldn't want to orchestrate that compilation using setuptools.

Do you need to run compilation of cuda_cccl/cooperative/parallel against CCCL headers?

cuda_cccl would just be nvidia-cuda-cccl-cuXX containing the headers but owned/maintained by the CCCL team for faster release cycles (think of it as cccl vs cuda-cccl on conda-forge)

cuda_cooperative JIT compiles CCCL headers at run time, so for all purposes the headers can be thought as shared libraries; no AOT compilation is needed

cuda_parallel is the most interesting case, because it does need to build the CCCL C shared library and include it in the wheel, but I dunno if building it requires NVCC + CCCL headers, or GCC/MSVC alone is enough

but I dunno if building it requires NVCC + CCCL headers, or GCC/MSVC alone is enough

Based on

adding -DCMAKE_VERBOSE_MAKEFILE=ON and looking at the output of

pip install --verbose ./cuda_parallel[test]

nvcc is required for compiling cccl/c/parallel/src/for.cu and reduce.cu:

cd /home/coder/cccl/python/cuda_parallel/build/temp.linux-x86_64-cpython-312/c/parallel && /usr/bin/sccache /usr/local/cuda/bin/nvcc -forward-unknown-to-host-compiler -ccbin=/usr/bin/g++ -DCCCL_C_EXPERIMENTAL=1 -DNVRTC_GET_TYPE_NAME=1 -D_CCCL_NO_SYSTEM_HEADER -Dcccl_c_parallel_EXPORTS --options-file CMakeFiles/cccl.c.parallel.dir/includes_CUDA.rsp -O3 -DNDEBUG -std=c++20 "--generate-code=arch=compute_52,code=[compute_52,sm_52]" -Xcompiler=-fPIC -Xcudafe=--display_error_number -Wno-deprecated-gpu-targets -Xcudafe=--promote_warnings -Wreorder -Xcompiler=-Werror -Xcompiler=-Wall -Xcompiler=-Wextra -Xcompiler=-Wreorder -Xcompiler=-Winit-self -Xcompiler=-Woverloaded-virtual -Xcompiler=-Wcast-qual -Xcompiler=-Wpointer-arith -Xcompiler=-Wvla -Xcompiler=-Wno-gnu-line-marker -Xcompiler=-Wno-gnu-zero-variadic-macro-arguments -Xcompiler=-Wno-unused-function -Xcompiler=-Wno-noexcept-type -MD -MT c/parallel/CMakeFiles/cccl.c.parallel.dir/src/for.cu.o -MF CMakeFiles/cccl.c.parallel.dir/src/for.cu.o.d -x cu -c /home/coder/cccl/c/parallel/src/for.cu -o CMakeFiles/cccl.c.parallel.dir/src/for.cu.o

cd /home/coder/cccl/python/cuda_parallel/build/temp.linux-x86_64-cpython-312/c/parallel && /usr/bin/sccache /usr/local/cuda/bin/nvcc -forward-unknown-to-host-compiler -ccbin=/usr/bin/g++ -DCCCL_C_EXPERIMENTAL=1 -DNVRTC_GET_TYPE_NAME=1 -D_CCCL_NO_SYSTEM_HEADER -Dcccl_c_parallel_EXPORTS --options-file CMakeFiles/cccl.c.parallel.dir/includes_CUDA.rsp -O3 -DNDEBUG -std=c++20 "--generate-code=arch=compute_52,code=[compute_52,sm_52]" -Xcompiler=-fPIC -Xcudafe=--display_error_number -Wno-deprecated-gpu-targets -Xcudafe=--promote_warnings -Wreorder -Xcompiler=-Werror -Xcompiler=-Wall -Xcompiler=-Wextra -Xcompiler=-Wreorder -Xcompiler=-Winit-self -Xcompiler=-Woverloaded-virtual -Xcompiler=-Wcast-qual -Xcompiler=-Wpointer-arith -Xcompiler=-Wvla -Xcompiler=-Wno-gnu-line-marker -Xcompiler=-Wno-gnu-zero-variadic-macro-arguments -Xcompiler=-Wno-unused-function -Xcompiler=-Wno-noexcept-type -MD -MT c/parallel/CMakeFiles/cccl.c.parallel.dir/src/reduce.cu.o -MF CMakeFiles/cccl.c.parallel.dir/src/reduce.cu.o.d -x cu -c /home/coder/cccl/c/parallel/src/reduce.cu -o CMakeFiles/cccl.c.parallel.dir/src/reduce.cu.o

I skimmed over the code and I am actually confused, because my impression is that the kernel compilation is still done at run time (JIT), and that the host logic can just be handled by a host compiler. @gevtushenko IIRC you built the prototype, any reason we have to use .cu files here and use NVCC to compile?

Commit 2913ae0 adopts the established _version.py handling.

leofang · 2024-12-19T19:47:54Z

pip install --editable does not work (anymore).

Q: In what way is it not working?

rwgk · 2024-12-19T19:54:14Z

pip install --editable does not work (anymore).

Q: In what way is it not working?

It is getting a non-existing path here:

cccl/python/cuda_parallel/cuda/parallel/experimental/_bindings.py

Line 57 in d6253b5

cub_include_path = str(f.parent / "_include")

At HEAD, cuda_paralleld/cuda/_include exists in the source directory (it is .gitignored), but with this PR, that directory no longer exists and the trick/hack I'm using in the code above fails.

rwgk · 2024-12-19T19:58:31Z

On August 30, 2014 @leofang wrote:

#2281 (comment)

Leo: Do you still recommend that we replace shutil.copytree() (in setup.py) with the cmake-based alternative?

I'm asking because that'll take this PR in a very different direction (I think).

rwgk · 2024-12-19T23:21:37Z

Logging an observation (JIC it's useful to reference this later):

With CCCL HEAD (I have @ d6253b5)

TL;DR: pip install for cuda_cooperative or cuda_parallel does not work correctly in the first pass.

@gevtushenko could this explain your "only works 50% of the time" experience?

Current working directory is cccl/python/

deactivate
rm -rf devenv
git clean -fdx cuda_cooperative/ >& /dev/null
python -m venv devenv
. devenv/bin/activate
pip install --verbose ./cuda_cooperative[test] >& ~/pip_install_cuda_cooperative_log1.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l
pip install --verbose ./cuda_cooperative[test] >& ~/pip_install_cuda_cooperative_log2.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l

The output is:

ls: cannot access 'devenv/lib/python3.12/site-packages/cuda/_include': No such file or directory
0
2076

Similarly for cuda_parallel:

deactivate
rm -rf devenv
git clean -fdx cuda_parallel/ >& /dev/null
python -m venv devenv
. devenv/bin/activate
pip install --verbose ./cuda_parallel[test] >& ~/pip_install_cuda_parallel_log1.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l
pip install --verbose ./cuda_parallel[test] >& ~/pip_install_cuda_parallel_log2.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l

Same output as above.

rwgk · 2024-12-19T23:32:37Z

Now with this PR (@ daab580)

TL;DR: Same problem (this had me really confused TBH).

deactivate
rm -rf devenv
git clean -fdx cuda_cccl/ >& /dev/null
python -m venv devenv
. devenv/bin/activate
pip install --verbose ./cuda_cccl[test] >& ~/pip_install_cuda_cccl_log1.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l
pip install --verbose ./cuda_cccl[test] >& ~/pip_install_cuda_cccl_log2.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l

Output:

ls: cannot access 'devenv/lib/python3.12/site-packages/cuda/_include': No such file or directory
0
2076

rwgk · 2024-12-19T23:37:34Z

Small summary:

pip install cuda_cooperative or cuda_parallel does not work reliably at HEAD.
Simply moving out cuda-cccl does not fix that.
But we have the bigger question: Should I even try to fix that? Or should I instead try to use CMake instead of setuptools?

rwgk · 2024-12-20T00:20:07Z

Commit ef9d5f4 makes the pip install ./cuda_cccl command work reliably.

I wouldn't be surprised if this isn't the right way of doing it, but it does work in one pass.

… cuda._include to find the include path.

rwgk · 2024-12-20T00:57:35Z

Commit bc116dc fixes the pip install --editable issue.

… (they are equivalent to the default functions)

rwgk · 2024-12-20T01:55:53Z

It turns out what I discovered the hard way was actually a known issue:

cccl/ci/test_python.sh

Lines 23 to 27 in d6253b5

    
           # Temporarily install the package twice to populate include directory as part of the first installation 
        
           # and to let manifest discover these includes during the second installation. Do not forget to remove the 
        
           # second installation after https://github.com/NVIDIA/cccl/issues/2281 is addressed. 
        
           run_command "⚙️  Pip install cuda_parallel once" pip install --force-reinstall --upgrade --target "${prefix}" .[test] 
        
           run_command "⚙️  Pip install cuda_parallel twice" pip install --force-reinstall --upgrade --target "${prefix}" .[test]

rwgk · 2024-12-20T01:57:51Z

/ok to test

github-actions · 2024-12-20T02:58:04Z

🟩 CI finished in 58m 34s: Pass: 100%/176 | Total: 1d 00h | Avg: 8m 22s | Max: 44m 12s | Hits: 99%/22510

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 29m | Avg: 9m 22s | Max: 36m 14s | Hits: 98%/9814

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total:  7h 23m | Avg:  9m 37s | Max: 36m 14s | Hits:  98%/9814  
  🟩 arm64              Pass: 100%/2   | Total:  6m 50s | Avg:  3m 25s | Max:  3m 31s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 54m 23s | Avg:  7m 46s | Max: 19m 13s | Hits:  98%/2239  
  🟩 12.5               Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 49s
  🟩 12.6               Pass: 100%/39  | Total:  6h 18m | Avg:  9m 41s | Max: 36m 14s | Hits:  98%/7575  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 06m | Avg: 16m 44s | Max: 20m 25s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 54m 23s | Avg:  7m 46s | Max: 19m 13s | Hits:  98%/2239  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 49s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  5h 11m | Avg:  8m 53s | Max: 36m 14s | Hits:  98%/7575  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 06m | Avg: 16m 44s | Max: 20m 25s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 22m | Avg:  8m 42s | Max: 36m 14s | Hits:  98%/9814  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 15m 17s | Avg:  3m 49s | Max:  4m 28s
  🟩 Clang10            Pass: 100%/1   | Total:  4m 45s | Avg:  4m 45s | Max:  4m 45s
  🟩 Clang11            Pass: 100%/1   | Total:  4m 10s | Avg:  4m 10s | Max:  4m 10s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 14s | Avg:  4m 14s | Max:  4m 14s
  🟩 Clang13            Pass: 100%/1   | Total:  4m 24s | Avg:  4m 24s | Max:  4m 24s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 02s | Avg:  4m 02s | Max:  4m 02s
  🟩 Clang15            Pass: 100%/1   | Total:  4m 38s | Avg:  4m 38s | Max:  4m 38s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 33s | Avg:  4m 33s | Max:  4m 33s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 14s | Avg:  4m 14s | Max:  4m 14s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 49m | Avg: 13m 43s | Max: 30m 21s
  🟩 GCC6               Pass: 100%/2   | Total: 10m 24s | Avg:  5m 12s | Max:  7m 46s
  🟩 GCC7               Pass: 100%/2   | Total:  6m 32s | Avg:  3m 16s | Max:  3m 28s
  🟩 GCC8               Pass: 100%/1   | Total:  3m 48s | Avg:  3m 48s | Max:  3m 48s
  🟩 GCC9               Pass: 100%/3   | Total: 21m 47s | Avg:  7m 15s | Max: 15m 38s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 47s | Avg:  3m 47s | Max:  3m 47s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 42s | Avg:  3m 42s | Max:  3m 42s
  🟩 GCC12              Pass: 100%/1   | Total:  3m 49s | Avg:  3m 49s | Max:  3m 49s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 32m | Avg: 15m 15s | Max: 36m 14s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  5m 37s | Avg:  5m 37s | Max:  5m 37s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 19m 13s | Avg: 19m 13s | Max: 19m 13s | Hits:  98%/2239  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 13m 12s | Avg: 13m 12s | Max: 13m 12s | Hits:  99%/2476  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 27m 54s | Avg: 13m 57s | Max: 15m 08s | Hits:  98%/5099  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 49s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  2h 40m | Avg:  8m 00s | Max: 30m 21s
  🟩 GCC                Pass: 100%/21  | Total:  3h 26m | Avg:  9m 49s | Max: 36m 14s
  🟩 Intel              Pass: 100%/1   | Total:  5m 37s | Avg:  5m 37s | Max:  5m 37s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 00m | Avg: 15m 04s | Max: 19m 13s | Hits:  98%/9814  
  🟩 NVHPC              Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 49s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total:  7h 29m | Avg:  9m 22s | Max: 36m 14s | Hits:  98%/9814  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total:  4h 41m | Avg:  6m 52s | Max: 20m 25s | Hits:  98%/9814  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 52m | Avg: 28m 11s | Max: 36m 14s
  🟩 Test               Pass: 100%/2   | Total: 53m 12s | Avg: 26m 36s | Max: 30m 21s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 04s | Avg:  2m 04s | Max:  2m 04s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 14m 37s | Avg: 14m 37s | Max: 14m 37s
  🟩 90a                Pass: 100%/2   | Total: 16m 02s | Avg:  8m 01s | Max: 12m 11s
🟩 std
  🟩 11                 Pass: 100%/6   | Total: 46m 47s | Avg:  7m 47s | Max: 31m 13s
  🟩 14                 Pass: 100%/5   | Total: 59m 13s | Avg: 11m 50s | Max: 24m 18s | Hits:  98%/2239  
  🟩 17                 Pass: 100%/13  | Total:  2h 00m | Avg:  9m 18s | Max: 21m 02s | Hits:  99%/4952  
  🟩 20                 Pass: 100%/23  | Total:  3h 40m | Avg:  9m 36s | Max: 36m 14s | Hits:  98%/2623

🟩 cub: Pass: 100%/47 | Total: 7h 03m | Avg: 9m 00s | Max: 31m 24s | Hits: 99%/3124

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  6h 53m | Avg:  9m 11s | Max: 31m 24s | Hits:  99%/3124  
  🟩 arm64              Pass: 100%/2   | Total:  9m 47s | Avg:  4m 53s | Max:  4m 59s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 41m 41s | Avg:  5m 57s | Max: 15m 29s | Hits:  99%/781   
  🟩 12.5               Pass: 100%/2   | Total: 18m 36s | Avg:  9m 18s | Max:  9m 23s
  🟩 12.6               Pass: 100%/38  | Total:  6h 02m | Avg:  9m 32s | Max: 31m 24s | Hits:  99%/2343  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 55s | Avg:  4m 27s | Max:  4m 36s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 41m 41s | Avg:  5m 57s | Max: 15m 29s | Hits:  99%/781   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 18m 36s | Avg:  9m 18s | Max:  9m 23s
  🟩 nvcc12.6           Pass: 100%/36  | Total:  5h 53m | Avg:  9m 49s | Max: 31m 24s | Hits:  99%/2343  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 55s | Avg:  4m 27s | Max:  4m 36s
  🟩 nvcc               Pass: 100%/45  | Total:  6h 54m | Avg:  9m 12s | Max: 31m 24s | Hits:  99%/3124  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 22m 04s | Avg:  5m 31s | Max:  6m 25s
  🟩 Clang10            Pass: 100%/1   | Total:  7m 01s | Avg:  7m 01s | Max:  7m 01s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 42s | Avg:  5m 42s | Max:  5m 42s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 38s | Avg:  5m 38s | Max:  5m 38s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 32s | Avg:  5m 32s | Max:  5m 32s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 51s | Avg:  5m 51s | Max:  5m 51s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 43s | Avg:  5m 43s | Max:  5m 43s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 34s | Avg:  5m 34s | Max:  5m 34s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 18m | Avg: 11m 10s | Max: 31m 24s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 23s | Avg:  4m 11s | Max:  4m 24s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 24s | Avg:  5m 12s | Max:  5m 13s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 30s | Avg:  5m 30s | Max:  5m 30s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 11s | Avg:  4m 43s | Max:  5m 37s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 48s | Avg:  5m 48s | Max:  5m 48s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 40s | Avg:  5m 40s | Max:  5m 40s
  🟩 GCC12              Pass: 100%/3   | Total: 25m 38s | Avg:  8m 32s | Max: 15m 50s
  🟩 GCC13              Pass: 100%/8   | Total:  2h 01m | Avg: 15m 09s | Max: 31m 13s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 49s | Avg:  6m 49s | Max:  6m 49s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 29s | Avg: 15m 29s | Max: 15m 29s | Hits:  99%/781   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 12m 05s | Avg: 12m 05s | Max: 12m 05s | Hits:  99%/781   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 26m 30s | Avg: 13m 15s | Max: 13m 43s | Hits:  99%/1562  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 18m 36s | Avg:  9m 18s | Max:  9m 23s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 26m | Avg:  7m 43s | Max: 31m 24s
  🟩 GCC                Pass: 100%/21  | Total:  3h 16m | Avg:  9m 22s | Max: 31m 13s
  🟩 Intel              Pass: 100%/1   | Total:  6m 49s | Avg:  6m 49s | Max:  6m 49s
  🟩 MSVC               Pass: 100%/4   | Total: 54m 04s | Avg: 13m 31s | Max: 15m 29s | Hits:  99%/3124  
  🟩 NVHPC              Pass: 100%/2   | Total: 18m 36s | Avg:  9m 18s | Max:  9m 23s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 01s | Avg: 10m 00s | Max: 15m 50s
  🟩 v100               Pass: 100%/45  | Total:  6h 43m | Avg:  8m 57s | Max: 31m 24s | Hits:  99%/3124  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 13m | Avg:  6m 20s | Max: 15m 29s | Hits:  99%/3124  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 24m 41s | Avg: 24m 41s | Max: 24m 41s
  🟩 GraphCapture       Pass: 100%/1   | Total: 27m 30s | Avg: 27m 30s | Max: 27m 30s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 03m | Avg: 21m 13s | Max: 31m 24s
  🟩 TestGPU            Pass: 100%/2   | Total: 53m 48s | Avg: 26m 54s | Max: 31m 13s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 20m 01s | Avg: 10m 00s | Max: 15m 50s
  🟩 90a                Pass: 100%/1   | Total:  4m 30s | Avg:  4m 30s | Max:  4m 30s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 24m 23s | Avg:  4m 52s | Max:  6m 25s
  🟩 14                 Pass: 100%/4   | Total: 31m 28s | Avg:  7m 52s | Max: 15m 29s | Hits:  99%/781   
  🟩 17                 Pass: 100%/12  | Total:  1h 24m | Avg:  7m 03s | Max: 13m 43s | Hits:  99%/1562  
  🟩 20                 Pass: 100%/26  | Total:  4h 42m | Avg: 10m 51s | Max: 31m 24s | Hits:  99%/781

🟩 thrust: Pass: 100%/46 | Total: 6h 20m | Avg: 8m 16s | Max: 33m 45s | Hits: 99%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 18m 32s | Avg:  9m 16s | Max: 12m 27s
🟩 cpu
  🟩 amd64              Pass: 100%/44  | Total:  6h 11m | Avg:  8m 26s | Max: 33m 45s | Hits:  99%/9260  
  🟩 arm64              Pass: 100%/2   | Total:  9m 38s | Avg:  4m 49s | Max:  5m 08s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 44m 55s | Avg:  6m 25s | Max: 18m 45s | Hits:  99%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 27m 55s | Avg: 13m 57s | Max: 14m 05s
  🟩 12.6               Pass: 100%/37  | Total:  5h 07m | Avg:  8m 19s | Max: 33m 45s | Hits:  99%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 10m 08s | Avg:  5m 04s | Max:  5m 07s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 44m 55s | Avg:  6m 25s | Max: 18m 45s | Hits:  99%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 27m 55s | Avg: 13m 57s | Max: 14m 05s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  4h 57m | Avg:  8m 30s | Max: 33m 45s | Hits:  99%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 10m 08s | Avg:  5m 04s | Max:  5m 07s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 10m | Avg:  8m 25s | Max: 33m 45s | Hits:  99%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 19s | Avg:  5m 19s | Max:  6m 25s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 42s | Avg:  6m 42s | Max:  6m 42s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 15s | Avg:  5m 15s | Max:  5m 15s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 23s | Avg:  5m 23s | Max:  5m 23s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 10s | Avg:  5m 10s | Max:  5m 10s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 46s | Avg:  5m 46s | Max:  5m 46s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 32s | Avg:  5m 32s | Max:  5m 32s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 07m | Avg:  9m 36s | Max: 33m 45s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 15s | Avg:  4m 07s | Max:  4m 09s
  🟩 GCC7               Pass: 100%/2   | Total:  9m 25s | Avg:  4m 42s | Max:  5m 01s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 00s | Avg:  5m 00s | Max:  5m 00s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 45s | Avg:  4m 55s | Max:  5m 54s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 42s | Avg:  5m 42s | Max:  5m 42s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 40s | Avg:  5m 40s | Max:  5m 40s
  🟩 GCC12              Pass: 100%/1   | Total:  6m 17s | Avg:  6m 17s | Max:  6m 17s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 05m | Avg:  8m 09s | Max: 17m 03s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 58s | Avg:  6m 58s | Max:  6m 58s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 18m 45s | Avg: 18m 45s | Max: 18m 45s | Hits:  99%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 15m 05s | Avg: 15m 05s | Max: 15m 05s | Hits:  99%/1852  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 58m 19s | Avg: 19m 26s | Max: 23m 53s | Hits:  99%/5556  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 27m 55s | Avg: 13m 57s | Max: 14m 05s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 13m | Avg:  7m 01s | Max: 33m 45s
  🟩 GCC                Pass: 100%/19  | Total:  2h 00m | Avg:  6m 19s | Max: 17m 03s
  🟩 Intel              Pass: 100%/1   | Total:  6m 58s | Avg:  6m 58s | Max:  6m 58s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 32m | Avg: 18m 25s | Max: 23m 53s | Hits:  99%/9260  
  🟩 NVHPC              Pass: 100%/2   | Total: 27m 55s | Avg: 13m 57s | Max: 14m 05s
🟩 gpu
  🟩 v100               Pass: 100%/46  | Total:  6h 20m | Avg:  8m 16s | Max: 33m 45s | Hits:  99%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 37m | Avg:  6m 56s | Max: 18m 45s | Hits:  99%/7408  
  🟩 TestCPU            Pass: 100%/3   | Total: 39m 40s | Avg: 13m 13s | Max: 23m 53s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 03m | Avg: 21m 05s | Max: 33m 45s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 28s | Avg:  4m 28s | Max:  4m 28s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 22m 32s | Avg:  4m 30s | Max:  5m 50s
  🟩 14                 Pass: 100%/4   | Total: 34m 17s | Avg:  8m 34s | Max: 18m 45s | Hits:  99%/1852  
  🟩 17                 Pass: 100%/12  | Total:  1h 36m | Avg:  8m 03s | Max: 17m 03s | Hits:  99%/3704  
  🟩 20                 Pass: 100%/23  | Total:  3h 28m | Avg:  9m 04s | Max: 33m 45s | Hits:  99%/3704

🟩 cudax: Pass: 100%/26 | Total: 2h 18m | Avg: 5m 19s | Max: 31m 25s | Hits: 92%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 07m | Avg:  5m 48s | Max: 31m 25s | Hits:  92%/312   
  🟩 arm64              Pass: 100%/4   | Total: 10m 21s | Avg:  2m 35s | Max:  2m 39s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 14m 27s | Avg:  4m 49s | Max:  8m 33s | Hits:  92%/156   
  🟩 12.5               Pass: 100%/2   | Total: 10m 57s | Avg:  5m 28s | Max:  5m 40s
  🟩 12.6               Pass: 100%/21  | Total:  1h 52m | Avg:  5m 22s | Max: 31m 25s | Hits:  92%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 14m 27s | Avg:  4m 49s | Max:  8m 33s | Hits:  92%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 10m 57s | Avg:  5m 28s | Max:  5m 40s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 52m | Avg:  5m 22s | Max: 31m 25s | Hits:  92%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 18m | Avg:  5m 19s | Max: 31m 25s | Hits:  92%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 03s | Avg:  3m 03s | Max:  3m 03s
  🟩 Clang10            Pass: 100%/1   | Total:  4m 03s | Avg:  4m 03s | Max:  4m 03s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 07s | Avg:  3m 07s | Max:  3m 07s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 17s | Avg:  3m 17s | Max:  3m 17s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 33s | Avg:  3m 33s | Max:  3m 33s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 14s | Avg:  3m 14s | Max:  3m 14s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 12s | Avg:  3m 12s | Max:  3m 12s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 16s | Avg:  3m 16s | Max:  3m 16s
  🟩 Clang18            Pass: 100%/4   | Total: 39m 45s | Avg:  9m 56s | Max: 31m 25s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 51s | Avg:  2m 51s | Max:  2m 51s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 23s | Avg:  3m 23s | Max:  3m 23s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 03s | Avg:  3m 03s | Max:  3m 03s
  🟩 GCC12              Pass: 100%/2   | Total: 20m 10s | Avg: 10m 05s | Max: 16m 46s
  🟩 GCC13              Pass: 100%/4   | Total: 10m 56s | Avg:  2m 44s | Max:  2m 58s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 33s | Avg:  8m 33s | Max:  8m 33s | Hits:  92%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 39s | Avg:  8m 39s | Max:  8m 39s | Hits:  92%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 10m 57s | Avg:  5m 28s | Max:  5m 40s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total:  1h 09m | Avg:  5m 21s | Max: 31m 25s
  🟩 GCC                Pass: 100%/9   | Total: 40m 23s | Avg:  4m 29s | Max: 16m 46s
  🟩 MSVC               Pass: 100%/2   | Total: 17m 12s | Avg:  8m 36s | Max:  8m 39s | Hits:  92%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 10m 57s | Avg:  5m 28s | Max:  5m 40s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 18m | Avg:  5m 19s | Max: 31m 25s | Hits:  92%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 30m | Avg:  3m 45s | Max:  8m 39s | Hits:  92%/312   
  🟩 Test               Pass: 100%/2   | Total: 48m 11s | Avg: 24m 05s | Max: 31m 25s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 58s | Avg:  2m 58s | Max:  2m 58s
  🟩 90a                Pass: 100%/1   | Total:  2m 45s | Avg:  2m 45s | Max:  2m 45s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 19m 42s | Avg:  3m 17s | Max:  5m 40s
  🟩 20                 Pass: 100%/20  | Total:  1h 58m | Avg:  5m 55s | Max: 31m 25s | Hits:  92%/312

🟩 cccl: Pass: 100%/6 | Total: 27m 15s | Avg: 4m 32s | Max: 4m 51s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 27m 15s | Avg:  4m 32s | Max:  4m 51s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  8m 47s | Avg:  4m 23s | Max:  4m 51s
  🟩 12.0               Pass: 100%/2   | Total:  9m 26s | Avg:  4m 43s | Max:  4m 45s
  🟩 12.6               Pass: 100%/2   | Total:  9m 02s | Avg:  4m 31s | Max:  4m 49s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  8m 47s | Avg:  4m 23s | Max:  4m 51s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  9m 26s | Avg:  4m 43s | Max:  4m 45s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 02s | Avg:  4m 31s | Max:  4m 49s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 27m 15s | Avg:  4m 32s | Max:  4m 51s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 51s | Avg:  4m 51s | Max:  4m 51s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 41s | Avg:  4m 41s | Max:  4m 41s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 49s | Avg:  4m 49s | Max:  4m 49s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 56s | Avg:  3m 56s | Max:  3m 56s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 45s | Avg:  4m 45s | Max:  4m 45s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 13s | Avg:  4m 13s | Max:  4m 13s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 14m 21s | Avg:  4m 47s | Max:  4m 51s
  🟩 GCC                Pass: 100%/3   | Total: 12m 54s | Avg:  4m 18s | Max:  4m 45s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 27m 15s | Avg:  4m 32s | Max:  4m 51s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 27m 15s | Avg:  4m 32s | Max:  4m 51s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 04s | Avg: 5m 02s | Max: 8m 04s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 00s | Avg:  2m 00s | Max:  2m 00s
  🟩 Test               Pass: 100%/1   | Total:  8m 04s | Avg:  8m 04s | Max:  8m 04s

🟩 python: Pass: 100%/1 | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 176)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

rwgk · 2024-12-20T03:17:05Z

This is ready for review now.

It's by no means fancy or ambitious, but I believe it's a meaningful conservative step in the right direction.

github-actions · 2024-12-20T05:04:34Z

🟩 CI finished in 1h 49m: Pass: 100%/176 | Total: 1d 00h | Avg: 8m 24s | Max: 50m 56s | Hits: 99%/22510

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 26m | Avg: 9m 17s | Max: 29m 26s | Hits: 98%/9814

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total:  7h 19m | Avg:  9m 32s | Max: 29m 26s | Hits:  98%/9814  
  🟩 arm64              Pass: 100%/2   | Total:  6m 52s | Avg:  3m 26s | Max:  3m 33s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total:  1h 16m | Avg: 10m 55s | Max: 22m 03s | Hits:  98%/2239  
  🟩 12.5               Pass: 100%/2   | Total: 16m 27s | Avg:  8m 13s | Max:  8m 20s
  🟩 12.6               Pass: 100%/39  | Total:  5h 53m | Avg:  9m 03s | Max: 29m 26s | Hits:  98%/7575  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 04m | Avg: 16m 12s | Max: 20m 12s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 16m | Avg: 10m 55s | Max: 22m 03s | Hits:  98%/2239  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 16m 27s | Avg:  8m 13s | Max:  8m 20s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  4h 48m | Avg:  8m 14s | Max: 29m 26s | Hits:  98%/7575  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 04m | Avg: 16m 12s | Max: 20m 12s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 21m | Avg:  8m 39s | Max: 29m 26s | Hits:  98%/9814  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 14m 36s | Avg:  3m 39s | Max:  4m 14s
  🟩 Clang10            Pass: 100%/1   | Total:  5m 09s | Avg:  5m 09s | Max:  5m 09s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 53s | Avg:  3m 53s | Max:  3m 53s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 00s | Avg:  4m 00s | Max:  4m 00s
  🟩 Clang13            Pass: 100%/1   | Total:  4m 06s | Avg:  4m 06s | Max:  4m 06s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 04s | Avg:  4m 04s | Max:  4m 04s
  🟩 Clang15            Pass: 100%/1   | Total:  4m 07s | Avg:  4m 07s | Max:  4m 07s
  🟩 Clang16            Pass: 100%/1   | Total: 17m 36s | Avg: 17m 36s | Max: 17m 36s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 03s | Avg:  4m 03s | Max:  4m 03s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 35m | Avg: 11m 58s | Max: 20m 12s
  🟩 GCC6               Pass: 100%/2   | Total: 24m 22s | Avg: 12m 11s | Max: 21m 21s
  🟩 GCC7               Pass: 100%/2   | Total:  6m 15s | Avg:  3m 07s | Max:  3m 19s
  🟩 GCC8               Pass: 100%/1   | Total:  3m 42s | Avg:  3m 42s | Max:  3m 42s
  🟩 GCC9               Pass: 100%/3   | Total: 28m 50s | Avg:  9m 36s | Max: 22m 03s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 38s | Avg:  3m 38s | Max:  3m 38s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 46s | Avg:  3m 46s | Max:  3m 46s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 04s | Avg:  4m 04s | Max:  4m 04s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 10m | Avg: 13m 02s | Max: 29m 26s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  5m 42s | Avg:  5m 42s | Max:  5m 42s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 21m 02s | Avg: 21m 02s | Max: 21m 02s | Hits:  98%/2239  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 14m 03s | Avg: 14m 03s | Max: 14m 03s | Hits:  99%/2476  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 26m 33s | Avg: 13m 16s | Max: 13m 57s | Hits:  98%/5099  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 16m 27s | Avg:  8m 13s | Max:  8m 20s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  2h 37m | Avg:  7m 52s | Max: 20m 12s
  🟩 GCC                Pass: 100%/21  | Total:  3h 25m | Avg:  9m 45s | Max: 29m 26s
  🟩 Intel              Pass: 100%/1   | Total:  5m 42s | Avg:  5m 42s | Max:  5m 42s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 01m | Avg: 15m 24s | Max: 21m 02s | Hits:  98%/9814  
  🟩 NVHPC              Pass: 100%/2   | Total: 16m 27s | Avg:  8m 13s | Max:  8m 20s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total:  7h 26m | Avg:  9m 17s | Max: 29m 26s | Hits:  98%/9814  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total:  5h 12m | Avg:  7m 37s | Max: 22m 03s | Hits:  98%/9814  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 35m | Avg: 23m 56s | Max: 29m 26s
  🟩 Test               Pass: 100%/2   | Total: 35m 43s | Avg: 17m 51s | Max: 18m 41s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 01s | Avg:  2m 01s | Max:  2m 01s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 13m 07s | Avg: 13m 07s | Max: 13m 07s
  🟩 90a                Pass: 100%/2   | Total: 17m 27s | Avg:  8m 43s | Max: 13m 30s
🟩 std
  🟩 11                 Pass: 100%/6   | Total:  1h 15m | Avg: 12m 31s | Max: 22m 03s
  🟩 14                 Pass: 100%/5   | Total:  1h 01m | Avg: 12m 12s | Max: 29m 26s | Hits:  98%/2239  
  🟩 17                 Pass: 100%/13  | Total:  1h 49m | Avg:  8m 23s | Max: 23m 18s | Hits:  99%/4952  
  🟩 20                 Pass: 100%/23  | Total:  3h 18m | Avg:  8m 38s | Max: 21m 13s | Hits:  98%/2623

🟩 cub: Pass: 100%/47 | Total: 7h 43m | Avg: 9m 51s | Max: 50m 56s | Hits: 99%/3124

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  7h 33m | Avg: 10m 04s | Max: 50m 56s | Hits:  99%/3124  
  🟩 arm64              Pass: 100%/2   | Total: 10m 05s | Avg:  5m 02s | Max:  5m 30s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 41m 53s | Avg:  5m 59s | Max: 15m 01s | Hits:  99%/781   
  🟩 12.5               Pass: 100%/2   | Total: 18m 14s | Avg:  9m 07s | Max:  9m 35s
  🟩 12.6               Pass: 100%/38  | Total:  6h 42m | Avg: 10m 36s | Max: 50m 56s | Hits:  99%/2343  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 22s | Avg:  4m 11s | Max:  4m 12s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 41m 53s | Avg:  5m 59s | Max: 15m 01s | Hits:  99%/781   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 18m 14s | Avg:  9m 07s | Max:  9m 35s
  🟩 nvcc12.6           Pass: 100%/36  | Total:  6h 34m | Avg: 10m 57s | Max: 50m 56s | Hits:  99%/2343  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 22s | Avg:  4m 11s | Max:  4m 12s
  🟩 nvcc               Pass: 100%/45  | Total:  7h 34m | Avg: 10m 06s | Max: 50m 56s | Hits:  99%/3124  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 46s | Avg:  5m 26s | Max:  6m 30s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 20s | Avg:  6m 20s | Max:  6m 20s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 05s | Avg:  5m 05s | Max:  5m 05s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 29s | Avg:  5m 29s | Max:  5m 29s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 04s | Avg:  5m 04s | Max:  5m 04s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 06s | Avg:  5m 06s | Max:  5m 06s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 16s | Avg:  5m 16s | Max:  5m 16s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 26s | Avg:  5m 26s | Max:  5m 26s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 39s | Avg:  5m 39s | Max:  5m 39s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 15m | Avg: 10m 44s | Max: 26m 36s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 50s | Avg:  4m 25s | Max:  4m 29s
  🟩 GCC7               Pass: 100%/2   | Total:  9m 55s | Avg:  4m 57s | Max:  5m 09s
  🟩 GCC8               Pass: 100%/1   | Total: 50m 56s | Avg: 50m 56s | Max: 50m 56s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 23s | Avg:  4m 47s | Max:  5m 41s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 28s | Avg:  5m 28s | Max:  5m 28s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 16s | Avg:  5m 16s | Max:  5m 16s
  🟩 GCC12              Pass: 100%/3   | Total: 28m 11s | Avg:  9m 23s | Max: 18m 06s
  🟩 GCC13              Pass: 100%/8   | Total:  2h 01m | Avg: 15m 14s | Max: 38m 55s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 56s | Avg:  6m 56s | Max:  6m 56s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 01s | Avg: 15m 01s | Max: 15m 01s | Hits:  99%/781   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 12m 05s | Avg: 12m 05s | Max: 12m 05s | Hits:  99%/781   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 25m 34s | Avg: 12m 47s | Max: 13m 09s | Hits:  99%/1562  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 18m 14s | Avg:  9m 07s | Max:  9m 35s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 20m | Avg:  7m 23s | Max: 26m 36s
  🟩 GCC                Pass: 100%/21  | Total:  4h 04m | Avg: 11m 39s | Max: 50m 56s
  🟩 Intel              Pass: 100%/1   | Total:  6m 56s | Avg:  6m 56s | Max:  6m 56s
  🟩 MSVC               Pass: 100%/4   | Total: 52m 40s | Avg: 13m 10s | Max: 15m 01s | Hits:  99%/3124  
  🟩 NVHPC              Pass: 100%/2   | Total: 18m 14s | Avg:  9m 07s | Max:  9m 35s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 22m 21s | Avg: 11m 10s | Max: 18m 06s
  🟩 v100               Pass: 100%/45  | Total:  7h 20m | Avg:  9m 47s | Max: 50m 56s | Hits:  99%/3124  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 53m | Avg:  7m 19s | Max: 50m 56s | Hits:  99%/3124  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 18m 10s | Avg: 18m 10s | Max: 18m 10s
  🟩 GraphCapture       Pass: 100%/1   | Total: 25m 10s | Avg: 25m 10s | Max: 25m 10s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 02m | Avg: 20m 55s | Max: 26m 36s
  🟩 TestGPU            Pass: 100%/2   | Total:  1h 03m | Avg: 31m 51s | Max: 38m 55s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 22m 21s | Avg: 11m 10s | Max: 18m 06s
  🟩 90a                Pass: 100%/1   | Total:  4m 07s | Avg:  4m 07s | Max:  4m 07s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 23m 51s | Avg:  4m 46s | Max:  5m 56s
  🟩 14                 Pass: 100%/4   | Total: 31m 09s | Avg:  7m 47s | Max: 15m 01s | Hits:  99%/781   
  🟩 17                 Pass: 100%/12  | Total:  2h 08m | Avg: 10m 41s | Max: 50m 56s | Hits:  99%/1562  
  🟩 20                 Pass: 100%/26  | Total:  4h 39m | Avg: 10m 45s | Max: 38m 55s | Hits:  99%/781

🟩 thrust: Pass: 100%/46 | Total: 6h 04m | Avg: 7m 55s | Max: 22m 03s | Hits: 99%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 20m 22s | Avg: 10m 11s | Max: 14m 45s
🟩 cpu
  🟩 amd64              Pass: 100%/44  | Total:  5h 55m | Avg:  8m 04s | Max: 22m 03s | Hits:  99%/9260  
  🟩 arm64              Pass: 100%/2   | Total:  9m 31s | Avg:  4m 45s | Max:  5m 03s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 44m 58s | Avg:  6m 25s | Max: 18m 14s | Hits:  99%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 28m 44s | Avg: 14m 22s | Max: 15m 04s
  🟩 12.6               Pass: 100%/37  | Total:  4h 51m | Avg:  7m 51s | Max: 22m 03s | Hits:  99%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  4m 47s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 44m 58s | Avg:  6m 25s | Max: 18m 14s | Hits:  99%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 28m 44s | Avg: 14m 22s | Max: 15m 04s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  4h 41m | Avg:  8m 02s | Max: 22m 03s | Hits:  99%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  4m 47s
  🟩 nvcc               Pass: 100%/44  | Total:  5h 55m | Avg:  8m 04s | Max: 22m 03s | Hits:  99%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 20m 51s | Avg:  5m 12s | Max:  6m 22s
  🟩 Clang10            Pass: 100%/1   | Total:  7m 07s | Avg:  7m 07s | Max:  7m 07s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 03s | Avg:  5m 03s | Max:  5m 03s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 01s | Avg:  5m 01s | Max:  5m 01s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 43s | Avg:  5m 43s | Max:  5m 43s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 26s | Avg:  5m 26s | Max:  5m 26s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 37s | Avg:  5m 37s | Max:  5m 37s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 10s | Avg:  5m 10s | Max:  5m 10s
  🟩 Clang18            Pass: 100%/7   | Total: 50m 21s | Avg:  7m 11s | Max: 18m 09s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 45s | Avg:  4m 22s | Max:  4m 31s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 18s | Avg:  5m 09s | Max:  5m 21s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 12s | Avg:  5m 12s | Max:  5m 12s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 55s | Avg:  4m 58s | Max:  6m 00s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 23s | Avg:  5m 23s | Max:  5m 23s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 GCC12              Pass: 100%/1   | Total:  5m 37s | Avg:  5m 37s | Max:  5m 37s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 08m | Avg:  8m 36s | Max: 18m 41s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  7m 00s | Avg:  7m 00s | Max:  7m 00s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 18m 14s | Avg: 18m 14s | Max: 18m 14s | Hits:  99%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 15m 42s | Avg: 15m 42s | Max: 15m 42s | Hits:  99%/1852  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 55m 06s | Avg: 18m 22s | Max: 22m 03s | Hits:  99%/5556  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 28m 44s | Avg: 14m 22s | Max: 15m 04s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  1h 55m | Avg:  6m 05s | Max: 18m 09s
  🟩 GCC                Pass: 100%/19  | Total:  2h 04m | Avg:  6m 32s | Max: 18m 41s
  🟩 Intel              Pass: 100%/1   | Total:  7m 00s | Avg:  7m 00s | Max:  7m 00s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 29m | Avg: 17m 48s | Max: 22m 03s | Hits:  99%/9260  
  🟩 NVHPC              Pass: 100%/2   | Total: 28m 44s | Avg: 14m 22s | Max: 15m 04s
🟩 gpu
  🟩 v100               Pass: 100%/46  | Total:  6h 04m | Avg:  7m 55s | Max: 22m 03s | Hits:  99%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 35m | Avg:  6m 53s | Max: 18m 14s | Hits:  99%/7408  
  🟩 TestCPU            Pass: 100%/3   | Total: 37m 39s | Avg: 12m 33s | Max: 22m 03s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/3   | Total: 51m 35s | Avg: 17m 11s | Max: 18m 41s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 36s | Avg:  4m 36s | Max:  4m 36s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 22m 44s | Avg:  4m 32s | Max:  5m 25s
  🟩 14                 Pass: 100%/4   | Total: 34m 28s | Avg:  8m 37s | Max: 18m 14s | Hits:  99%/1852  
  🟩 17                 Pass: 100%/12  | Total:  1h 37m | Avg:  8m 09s | Max: 17m 14s | Hits:  99%/3704  
  🟩 20                 Pass: 100%/23  | Total:  3h 09m | Avg:  8m 13s | Max: 22m 03s | Hits:  99%/3704

🟩 cudax: Pass: 100%/26 | Total: 2h 02m | Avg: 4m 42s | Max: 17m 50s | Hits: 92%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  1h 51m | Avg:  5m 04s | Max: 17m 50s | Hits:  92%/312   
  🟩 arm64              Pass: 100%/4   | Total: 10m 49s | Avg:  2m 42s | Max:  3m 02s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 14m 04s | Avg:  4m 41s | Max:  8m 30s | Hits:  92%/156   
  🟩 12.5               Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  5m 03s
  🟩 12.6               Pass: 100%/21  | Total:  1h 38m | Avg:  4m 41s | Max: 17m 50s | Hits:  92%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 14m 04s | Avg:  4m 41s | Max:  8m 30s | Hits:  92%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  5m 03s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 38m | Avg:  4m 41s | Max: 17m 50s | Hits:  92%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 02m | Avg:  4m 42s | Max: 17m 50s | Hits:  92%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  2m 54s | Avg:  2m 54s | Max:  2m 54s
  🟩 Clang10            Pass: 100%/1   | Total:  3m 57s | Avg:  3m 57s | Max:  3m 57s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 16s | Avg:  3m 16s | Max:  3m 16s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 00s | Avg:  3m 00s | Max:  3m 00s
  🟩 Clang13            Pass: 100%/1   | Total:  2m 55s | Avg:  2m 55s | Max:  2m 55s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 17s | Avg:  3m 17s | Max:  3m 17s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 14s | Avg:  3m 14s | Max:  3m 14s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 09s | Avg:  3m 09s | Max:  3m 09s
  🟩 Clang18            Pass: 100%/4   | Total: 25m 49s | Avg:  6m 27s | Max: 16m 52s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 40s | Avg:  2m 40s | Max:  2m 40s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 GCC11              Pass: 100%/1   | Total:  2m 56s | Avg:  2m 56s | Max:  2m 56s
  🟩 GCC12              Pass: 100%/2   | Total: 20m 51s | Avg: 10m 25s | Max: 17m 50s
  🟩 GCC13              Pass: 100%/4   | Total: 11m 00s | Avg:  2m 45s | Max:  2m 56s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 30s | Avg:  8m 30s | Max:  8m 30s | Hits:  92%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 46s | Avg:  8m 46s | Max:  8m 46s | Hits:  92%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  5m 03s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total: 54m 44s | Avg:  4m 12s | Max: 16m 52s
  🟩 GCC                Pass: 100%/9   | Total: 40m 40s | Avg:  4m 31s | Max: 17m 50s
  🟩 MSVC               Pass: 100%/2   | Total: 17m 16s | Avg:  8m 38s | Max:  8m 46s | Hits:  92%/312   
  🟩 NVHPC              Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  5m 03s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 02m | Avg:  4m 42s | Max: 17m 50s | Hits:  92%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 27m | Avg:  3m 39s | Max:  8m 46s | Hits:  92%/312   
  🟩 Test               Pass: 100%/2   | Total: 34m 42s | Avg: 17m 21s | Max: 17m 50s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 52s | Avg:  2m 52s | Max:  2m 52s
  🟩 90a                Pass: 100%/1   | Total:  2m 56s | Avg:  2m 56s | Max:  2m 56s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 19m 06s | Avg:  3m 11s | Max:  5m 03s
  🟩 20                 Pass: 100%/20  | Total:  1h 43m | Avg:  5m 10s | Max: 17m 50s | Hits:  92%/312

🟩 cccl: Pass: 100%/6 | Total: 25m 09s | Avg: 4m 11s | Max: 4m 32s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 25m 09s | Avg:  4m 11s | Max:  4m 32s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 43s | Avg:  3m 51s | Max:  4m 11s
  🟩 12.0               Pass: 100%/2   | Total:  8m 27s | Avg:  4m 13s | Max:  4m 23s
  🟩 12.6               Pass: 100%/2   | Total:  8m 59s | Avg:  4m 29s | Max:  4m 32s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 43s | Avg:  3m 51s | Max:  4m 11s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  8m 27s | Avg:  4m 13s | Max:  4m 23s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  8m 59s | Avg:  4m 29s | Max:  4m 32s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 25m 09s | Avg:  4m 11s | Max:  4m 32s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 11s | Avg:  4m 11s | Max:  4m 11s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 23s | Avg:  4m 23s | Max:  4m 23s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 32s | Avg:  4m 32s | Max:  4m 32s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 32s | Avg:  3m 32s | Max:  3m 32s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 04s | Avg:  4m 04s | Max:  4m 04s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 27s | Avg:  4m 27s | Max:  4m 27s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 13m 06s | Avg:  4m 22s | Max:  4m 32s
  🟩 GCC                Pass: 100%/3   | Total: 12m 03s | Avg:  4m 01s | Max:  4m 27s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 25m 09s | Avg:  4m 11s | Max:  4m 32s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 25m 09s | Avg:  4m 11s | Max:  4m 32s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 32s | Avg: 4m 46s | Max: 7m 36s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total:  9m 32s | Avg:  4m 46s | Max:  7m 36s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total:  9m 32s | Avg:  4m 46s | Max:  7m 36s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 32s | Avg:  4m 46s | Max:  7m 36s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total:  9m 32s | Avg:  4m 46s | Max:  7m 36s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total:  9m 32s | Avg:  4m 46s | Max:  7m 36s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total:  9m 32s | Avg:  4m 46s | Max:  7m 36s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total:  9m 32s | Avg:  4m 46s | Max:  7m 36s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  1m 56s | Avg:  1m 56s | Max:  1m 56s
  🟩 Test               Pass: 100%/1   | Total:  7m 36s | Avg:  7m 36s | Max:  7m 36s

🟩 python: Pass: 100%/1 | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 176)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

Add cccl/python/cuda_cccl directory and use from cuda_parallel, cuda_…

daab580

…cooperative

rwgk mentioned this pull request Dec 19, 2024

[FEA]: Introduce Python module with CCCL headers #2281

Open

1 task

leofang reviewed Dec 19, 2024

View reviewed changes

Run copy_cccl_headers_to_aude_include() before setup()

ef9d5f4

Create python/cuda_cccl/cuda/_include/__init__.py, then simply import…

bc116dc

… cuda._include to find the include path.

rwgk added 4 commits December 19, 2024 17:18

Add cuda.cccl._version exactly as for cuda.cooperative and cuda.parallel

2913ae0

Bug fix: cuda/_include only exists after shutil.copytree() ran.

7dbb82b

Use f"cuda-cccl @ file://{cccl_path}/python/cuda_cccl" in setup.py

0703901

Remove CustomBuildCommand, CustomWheelBuild in cuda_parallel/setup.py…

fc0e543

… (they are equivalent to the default functions)

Replace := operator (needs Python 3.8+)

2e64345

rwgk marked this pull request as ready for review December 20, 2024 03:13

rwgk requested review from a team as code owners December 20, 2024 03:13

rwgk requested review from jrhemstad and miscco and removed request for miscco and jrhemstad December 20, 2024 03:13

rwgk requested review from gevtushenko and shwina December 20, 2024 03:15

leofang self-requested a review December 20, 2024 04:00

[FEA]: Introduce Python module with CCCL headers #3201

Are you sure you want to change the base?

[FEA]: Introduce Python module with CCCL headers #3201

Conversation

rwgk commented Dec 19, 2024 • edited Loading

Description

copy-pr-bot bot commented Dec 19, 2024

leofang Dec 19, 2024

Choose a reason for hiding this comment

rwgk Dec 19, 2024

Choose a reason for hiding this comment

vyasr Dec 19, 2024

Choose a reason for hiding this comment

vyasr Dec 19, 2024

Choose a reason for hiding this comment

leofang Dec 19, 2024 • edited Loading

Choose a reason for hiding this comment

rwgk Dec 19, 2024

Choose a reason for hiding this comment

leofang Dec 19, 2024 • edited Loading

Choose a reason for hiding this comment

rwgk Dec 20, 2024

Choose a reason for hiding this comment

leofang commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 20, 2024

rwgk commented Dec 20, 2024

rwgk commented Dec 20, 2024

rwgk commented Dec 20, 2024

github-actions bot commented Dec 20, 2024

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 29m | Avg: 9m 22s | Max: 36m 14s | Hits: 98%/9814

🟩 cub: Pass: 100%/47 | Total: 7h 03m | Avg: 9m 00s | Max: 31m 24s | Hits: 99%/3124

🟩 thrust: Pass: 100%/46 | Total: 6h 20m | Avg: 8m 16s | Max: 33m 45s | Hits: 99%/9260

🟩 cudax: Pass: 100%/26 | Total: 2h 18m | Avg: 5m 19s | Max: 31m 25s | Hits: 92%/312

🟩 cccl: Pass: 100%/6 | Total: 27m 15s | Avg: 4m 32s | Max: 4m 51s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 04s | Avg: 5m 02s | Max: 8m 04s

🟩 python: Pass: 100%/1 | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 176)

rwgk commented Dec 20, 2024

github-actions bot commented Dec 20, 2024

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 26m | Avg: 9m 17s | Max: 29m 26s | Hits: 98%/9814

🟩 cub: Pass: 100%/47 | Total: 7h 43m | Avg: 9m 51s | Max: 50m 56s | Hits: 99%/3124

🟩 thrust: Pass: 100%/46 | Total: 6h 04m | Avg: 7m 55s | Max: 22m 03s | Hits: 99%/9260

🟩 cudax: Pass: 100%/26 | Total: 2h 02m | Avg: 4m 42s | Max: 17m 50s | Hits: 92%/312

🟩 cccl: Pass: 100%/6 | Total: 25m 09s | Avg: 4m 11s | Max: 4m 32s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 32s | Avg: 4m 46s | Max: 7m 36s

🟩 python: Pass: 100%/1 | Total: 49m 37s | Avg: 49m 37s | Max: 49m 37s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 176)

rwgk commented Dec 19, 2024 •

edited

Loading

leofang Dec 19, 2024 •

edited

Loading

leofang Dec 19, 2024 •

edited

Loading