[FEA]: Introduce Python module with CCCL headers #3201

rwgk · 2024-12-19T19:24:52Z

Description

Factor out cuda-cccl pip-installable package (cccl/python/cuda_cccl) with CCCL headers from cuda-cooperative and cuda-parallel.
- Bug fix: Call copy_cccl_headers_to_cuda_cccl_include() before calling setup(), so that pip install works as expected in one pass. Resolves this.
- Note: Currently cuda-cccl is not (and does not need to be) published on PyPI.
Factor out cuda.cccl.include_paths from cuda.cooperative.experimental._nvrtc and cuda.parallel.experimental._bindings.
Comprehensive pyproject.toml, setup.py modernization in cuda_cccl, cuda_cooperative, cuda_parallel.
os.path -> pathlib modernization in all .py files touched by this PR.
Add pre-commit TOML lint & format — taplo-pre-commit

Note for completeness:

I spent a significant amount of time trying to use hatchling as the build backend (instead of setuptools):

61637d6

With that commit, pip install worked, but pip install --editable did not. The root cause is this file installed by cuda-python:

https://github.com/NVIDIA/cuda-python/blob/54a93e677b9ba5980dff24c649aa61e004f64416/cuda_bindings/cuda/__init__.py

This file interferes with Python's Implicit Namespace Packages mechanism, which is what hatchling relies on in --editable mode.

…cooperative

copy-pr-bot · 2024-12-19T19:24:55Z

Auto-sync is disabled for draft pull requests in this repository. Workflows must be run manually.

Contributors can view more details about this message here.

leofang · 2024-12-19T19:47:00Z

python/cuda_cccl/setup.py

+project_path = os.path.abspath(os.path.dirname(__file__))
+cccl_path = os.path.abspath(os.path.join(project_path, "..", ".."))
+cccl_headers = [["cub", "cub"], ["libcudacxx", "include"], ["thrust", "thrust"]]
+ver = "0.1.2.8.0"


I think we need to use the CCCL version here, not CCCL Python modules' version. We should also not hard-code it, but instead read from CMakeLists which is the source of truth AFAIK, and for that setuptools might not be doing the job. @vyasr might have a simple example for how this can be done with scikit-build-core.

Ack. I added this is a bullet to the PR description.

Check out the dynamic metadata section, specifically the Regex tab.

You would need to rewrite everything here to use CMake instead of setuptools. Depending on what this module is trying to do that may or may not be beneficial. Do you need to run compilation of cuda_cccl/cooperative/parallel against CCCL headers? In that case it is almost certainly worthwhile, I wouldn't want to orchestrate that compilation using setuptools.

Do you need to run compilation of cuda_cccl/cooperative/parallel against CCCL headers?

cuda_cccl would just be nvidia-cuda-cccl-cuXX containing the headers but owned/maintained by the CCCL team for faster release cycles (think of it as cccl vs cuda-cccl on conda-forge)

cuda_cooperative JIT compiles CCCL headers at run time, so for all purposes the headers can be thought as shared libraries; no AOT compilation is needed

cuda_parallel is the most interesting case, because it does need to build the CCCL C shared library and include it in the wheel, but I dunno if building it requires NVCC + CCCL headers, or GCC/MSVC alone is enough

but I dunno if building it requires NVCC + CCCL headers, or GCC/MSVC alone is enough

Based on

adding -DCMAKE_VERBOSE_MAKEFILE=ON and looking at the output of

pip install --verbose ./cuda_parallel[test]

nvcc is required for compiling cccl/c/parallel/src/for.cu and reduce.cu:

cd /home/coder/cccl/python/cuda_parallel/build/temp.linux-x86_64-cpython-312/c/parallel && /usr/bin/sccache /usr/local/cuda/bin/nvcc -forward-unknown-to-host-compiler -ccbin=/usr/bin/g++ -DCCCL_C_EXPERIMENTAL=1 -DNVRTC_GET_TYPE_NAME=1 -D_CCCL_NO_SYSTEM_HEADER -Dcccl_c_parallel_EXPORTS --options-file CMakeFiles/cccl.c.parallel.dir/includes_CUDA.rsp -O3 -DNDEBUG -std=c++20 "--generate-code=arch=compute_52,code=[compute_52,sm_52]" -Xcompiler=-fPIC -Xcudafe=--display_error_number -Wno-deprecated-gpu-targets -Xcudafe=--promote_warnings -Wreorder -Xcompiler=-Werror -Xcompiler=-Wall -Xcompiler=-Wextra -Xcompiler=-Wreorder -Xcompiler=-Winit-self -Xcompiler=-Woverloaded-virtual -Xcompiler=-Wcast-qual -Xcompiler=-Wpointer-arith -Xcompiler=-Wvla -Xcompiler=-Wno-gnu-line-marker -Xcompiler=-Wno-gnu-zero-variadic-macro-arguments -Xcompiler=-Wno-unused-function -Xcompiler=-Wno-noexcept-type -MD -MT c/parallel/CMakeFiles/cccl.c.parallel.dir/src/for.cu.o -MF CMakeFiles/cccl.c.parallel.dir/src/for.cu.o.d -x cu -c /home/coder/cccl/c/parallel/src/for.cu -o CMakeFiles/cccl.c.parallel.dir/src/for.cu.o

cd /home/coder/cccl/python/cuda_parallel/build/temp.linux-x86_64-cpython-312/c/parallel && /usr/bin/sccache /usr/local/cuda/bin/nvcc -forward-unknown-to-host-compiler -ccbin=/usr/bin/g++ -DCCCL_C_EXPERIMENTAL=1 -DNVRTC_GET_TYPE_NAME=1 -D_CCCL_NO_SYSTEM_HEADER -Dcccl_c_parallel_EXPORTS --options-file CMakeFiles/cccl.c.parallel.dir/includes_CUDA.rsp -O3 -DNDEBUG -std=c++20 "--generate-code=arch=compute_52,code=[compute_52,sm_52]" -Xcompiler=-fPIC -Xcudafe=--display_error_number -Wno-deprecated-gpu-targets -Xcudafe=--promote_warnings -Wreorder -Xcompiler=-Werror -Xcompiler=-Wall -Xcompiler=-Wextra -Xcompiler=-Wreorder -Xcompiler=-Winit-self -Xcompiler=-Woverloaded-virtual -Xcompiler=-Wcast-qual -Xcompiler=-Wpointer-arith -Xcompiler=-Wvla -Xcompiler=-Wno-gnu-line-marker -Xcompiler=-Wno-gnu-zero-variadic-macro-arguments -Xcompiler=-Wno-unused-function -Xcompiler=-Wno-noexcept-type -MD -MT c/parallel/CMakeFiles/cccl.c.parallel.dir/src/reduce.cu.o -MF CMakeFiles/cccl.c.parallel.dir/src/reduce.cu.o.d -x cu -c /home/coder/cccl/c/parallel/src/reduce.cu -o CMakeFiles/cccl.c.parallel.dir/src/reduce.cu.o

I skimmed over the code and I am actually confused, because my impression is that the kernel compilation is still done at run time (JIT), and that the host logic can just be handled by a host compiler. @gevtushenko IIRC you built the prototype, any reason we have to use .cu files here and use NVCC to compile?

Commit 2913ae0 adopts the established _version.py handling.

tl;dr I would suggest that if you have to do any compilation whatsoever beyond pure Cython you switch away from setuptools, but if you don't have any compiled modules at build time then stick to setuptools or use another backend that isn't designed for compilation (hatchling would be a great choice).

@gevtushenko IIRC you built the prototype, any reason we have to use .cu files here and use NVCC to compile?

In the offline call Georgii reminded me that there are some CUB structs that we need to pre-compile to pass around. Since generally CUB headers are not host compilable, NVCC has to be used, but we don't generate any GPU-specific code.

leofang · 2024-12-19T19:47:54Z

pip install --editable does not work (anymore).

Q: In what way is it not working?

rwgk · 2024-12-19T19:54:14Z

pip install --editable does not work (anymore).

Q: In what way is it not working?

It is getting a non-existing path here:

cccl/python/cuda_parallel/cuda/parallel/experimental/_bindings.py

Line 57 in d6253b5

cub_include_path = str(f.parent / "_include")

At HEAD, cuda_paralleld/cuda/_include exists in the source directory (it is .gitignored), but with this PR, that directory no longer exists and the trick/hack I'm using in the code above fails.

rwgk · 2024-12-19T19:58:31Z

On August 30, 2014 @leofang wrote:

#2281 (comment)

Leo: Do you still recommend that we replace shutil.copytree() (in setup.py) with the cmake-based alternative?

I'm asking because that'll take this PR in a very different direction (I think).

rwgk · 2024-12-19T23:21:37Z

Logging an observation (JIC it's useful to reference this later):

With CCCL HEAD (I have @ d6253b5)

TL;DR: pip install for cuda_cooperative or cuda_parallel does not work correctly in the first pass.

@gevtushenko could this explain your "only works 50% of the time" experience?

Current working directory is cccl/python/

deactivate
rm -rf devenv
git clean -fdx cuda_cooperative/ >& /dev/null
python -m venv devenv
. devenv/bin/activate
pip install --verbose ./cuda_cooperative[test] >& ~/pip_install_cuda_cooperative_log1.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l
pip install --verbose ./cuda_cooperative[test] >& ~/pip_install_cuda_cooperative_log2.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l

The output is:

ls: cannot access 'devenv/lib/python3.12/site-packages/cuda/_include': No such file or directory
0
2076

Similarly for cuda_parallel:

deactivate
rm -rf devenv
git clean -fdx cuda_parallel/ >& /dev/null
python -m venv devenv
. devenv/bin/activate
pip install --verbose ./cuda_parallel[test] >& ~/pip_install_cuda_parallel_log1.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l
pip install --verbose ./cuda_parallel[test] >& ~/pip_install_cuda_parallel_log2.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l

Same output as above.

rwgk · 2024-12-19T23:32:37Z

Now with this PR (@ daab580)

TL;DR: Same problem (this had me really confused TBH).

deactivate
rm -rf devenv
git clean -fdx cuda_cccl/ >& /dev/null
python -m venv devenv
. devenv/bin/activate
pip install --verbose ./cuda_cccl[test] >& ~/pip_install_cuda_cccl_log1.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l
pip install --verbose ./cuda_cccl[test] >& ~/pip_install_cuda_cccl_log2.txt
ls -lR devenv/lib/python3.12/site-packages/cuda/_include | wc -l

Output:

ls: cannot access 'devenv/lib/python3.12/site-packages/cuda/_include': No such file or directory
0
2076

rwgk · 2024-12-19T23:37:34Z

Small summary:

pip install cuda_cooperative or cuda_parallel does not work reliably at HEAD.
Simply moving out cuda-cccl does not fix that.
But we have the bigger question: Should I even try to fix that? Or should I instead try to use CMake instead of setuptools?

rwgk · 2024-12-20T00:20:07Z

Commit ef9d5f4 makes the pip install ./cuda_cccl command work reliably.

I wouldn't be surprised if this isn't the right way of doing it, but it does work in one pass.

… cuda._include to find the include path.

rwgk · 2024-12-20T00:57:35Z

Commit bc116dc fixes the pip install --editable issue.

… (they are equivalent to the default functions)

rwgk · 2024-12-20T01:55:53Z

It turns out what I discovered the hard way was actually a known issue:

cccl/ci/test_python.sh

Lines 23 to 27 in d6253b5

    
           # Temporarily install the package twice to populate include directory as part of the first installation 
        
           # and to let manifest discover these includes during the second installation. Do not forget to remove the 
        
           # second installation after https://github.com/NVIDIA/cccl/issues/2281 is addressed. 
        
           run_command "⚙️  Pip install cuda_parallel once" pip install --force-reinstall --upgrade --target "${prefix}" .[test] 
        
           run_command "⚙️  Pip install cuda_parallel twice" pip install --force-reinstall --upgrade --target "${prefix}" .[test]

rwgk · 2024-12-20T01:57:51Z

/ok to test

github-actions · 2024-12-20T02:58:04Z

🟩 CI finished in 58m 34s: Pass: 100%/176 | Total: 1d 00h | Avg: 8m 22s | Max: 44m 12s | Hits: 99%/22510

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 29m | Avg: 9m 22s | Max: 36m 14s | Hits: 98%/9814

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total:  7h 23m | Avg:  9m 37s | Max: 36m 14s | Hits:  98%/9814  
  🟩 arm64              Pass: 100%/2   | Total:  6m 50s | Avg:  3m 25s | Max:  3m 31s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 54m 23s | Avg:  7m 46s | Max: 19m 13s | Hits:  98%/2239  
  🟩 12.5               Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 49s
  🟩 12.6               Pass: 100%/39  | Total:  6h 18m | Avg:  9m 41s | Max: 36m 14s | Hits:  98%/7575  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 06m | Avg: 16m 44s | Max: 20m 25s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 54m 23s | Avg:  7m 46s | Max: 19m 13s | Hits:  98%/2239  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 49s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  5h 11m | Avg:  8m 53s | Max: 36m 14s | Hits:  98%/7575  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 06m | Avg: 16m 44s | Max: 20m 25s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 22m | Avg:  8m 42s | Max: 36m 14s | Hits:  98%/9814  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 15m 17s | Avg:  3m 49s | Max:  4m 28s
  🟩 Clang10            Pass: 100%/1   | Total:  4m 45s | Avg:  4m 45s | Max:  4m 45s
  🟩 Clang11            Pass: 100%/1   | Total:  4m 10s | Avg:  4m 10s | Max:  4m 10s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 14s | Avg:  4m 14s | Max:  4m 14s
  🟩 Clang13            Pass: 100%/1   | Total:  4m 24s | Avg:  4m 24s | Max:  4m 24s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 02s | Avg:  4m 02s | Max:  4m 02s
  🟩 Clang15            Pass: 100%/1   | Total:  4m 38s | Avg:  4m 38s | Max:  4m 38s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 33s | Avg:  4m 33s | Max:  4m 33s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 14s | Avg:  4m 14s | Max:  4m 14s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 49m | Avg: 13m 43s | Max: 30m 21s
  🟩 GCC6               Pass: 100%/2   | Total: 10m 24s | Avg:  5m 12s | Max:  7m 46s
  🟩 GCC7               Pass: 100%/2   | Total:  6m 32s | Avg:  3m 16s | Max:  3m 28s
  🟩 GCC8               Pass: 100%/1   | Total:  3m 48s | Avg:  3m 48s | Max:  3m 48s
  🟩 GCC9               Pass: 100%/3   | Total: 21m 47s | Avg:  7m 15s | Max: 15m 38s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 47s | Avg:  3m 47s | Max:  3m 47s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 42s | Avg:  3m 42s | Max:  3m 42s
  🟩 GCC12              Pass: 100%/1   | Total:  3m 49s | Avg:  3m 49s | Max:  3m 49s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 32m | Avg: 15m 15s | Max: 36m 14s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  5m 37s | Avg:  5m 37s | Max:  5m 37s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 19m 13s | Avg: 19m 13s | Max: 19m 13s | Hits:  98%/2239  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 13m 12s | Avg: 13m 12s | Max: 13m 12s | Hits:  99%/2476  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 27m 54s | Avg: 13m 57s | Max: 15m 08s | Hits:  98%/5099  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 49s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  2h 40m | Avg:  8m 00s | Max: 30m 21s
  🟩 GCC                Pass: 100%/21  | Total:  3h 26m | Avg:  9m 49s | Max: 36m 14s
  🟩 Intel              Pass: 100%/1   | Total:  5m 37s | Avg:  5m 37s | Max:  5m 37s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 00m | Avg: 15m 04s | Max: 19m 13s | Hits:  98%/9814  
  🟩 NVHPC              Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 49s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total:  7h 29m | Avg:  9m 22s | Max: 36m 14s | Hits:  98%/9814  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total:  4h 41m | Avg:  6m 52s | Max: 20m 25s | Hits:  98%/9814  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 52m | Avg: 28m 11s | Max: 36m 14s
  🟩 Test               Pass: 100%/2   | Total: 53m 12s | Avg: 26m 36s | Max: 30m 21s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 04s | Avg:  2m 04s | Max:  2m 04s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 14m 37s | Avg: 14m 37s | Max: 14m 37s
  🟩 90a                Pass: 100%/2   | Total: 16m 02s | Avg:  8m 01s | Max: 12m 11s
🟩 std
  🟩 11                 Pass: 100%/6   | Total: 46m 47s | Avg:  7m 47s | Max: 31m 13s
  🟩 14                 Pass: 100%/5   | Total: 59m 13s | Avg: 11m 50s | Max: 24m 18s | Hits:  98%/2239  
  🟩 17                 Pass: 100%/13  | Total:  2h 00m | Avg:  9m 18s | Max: 21m 02s | Hits:  99%/4952  
  🟩 20                 Pass: 100%/23  | Total:  3h 40m | Avg:  9m 36s | Max: 36m 14s | Hits:  98%/2623

🟩 cub: Pass: 100%/47 | Total: 7h 03m | Avg: 9m 00s | Max: 31m 24s | Hits: 99%/3124

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  6h 53m | Avg:  9m 11s | Max: 31m 24s | Hits:  99%/3124  
  🟩 arm64              Pass: 100%/2   | Total:  9m 47s | Avg:  4m 53s | Max:  4m 59s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 41m 41s | Avg:  5m 57s | Max: 15m 29s | Hits:  99%/781   
  🟩 12.5               Pass: 100%/2   | Total: 18m 36s | Avg:  9m 18s | Max:  9m 23s
  🟩 12.6               Pass: 100%/38  | Total:  6h 02m | Avg:  9m 32s | Max: 31m 24s | Hits:  99%/2343  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 55s | Avg:  4m 27s | Max:  4m 36s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 41m 41s | Avg:  5m 57s | Max: 15m 29s | Hits:  99%/781   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 18m 36s | Avg:  9m 18s | Max:  9m 23s
  🟩 nvcc12.6           Pass: 100%/36  | Total:  5h 53m | Avg:  9m 49s | Max: 31m 24s | Hits:  99%/2343  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 55s | Avg:  4m 27s | Max:  4m 36s
  🟩 nvcc               Pass: 100%/45  | Total:  6h 54m | Avg:  9m 12s | Max: 31m 24s | Hits:  99%/3124  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 22m 04s | Avg:  5m 31s | Max:  6m 25s
  🟩 Clang10            Pass: 100%/1   | Total:  7m 01s | Avg:  7m 01s | Max:  7m 01s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 42s | Avg:  5m 42s | Max:  5m 42s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 38s | Avg:  5m 38s | Max:  5m 38s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 32s | Avg:  5m 32s | Max:  5m 32s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 51s | Avg:  5m 51s | Max:  5m 51s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 43s | Avg:  5m 43s | Max:  5m 43s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 34s | Avg:  5m 34s | Max:  5m 34s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 18m | Avg: 11m 10s | Max: 31m 24s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 23s | Avg:  4m 11s | Max:  4m 24s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 24s | Avg:  5m 12s | Max:  5m 13s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 30s | Avg:  5m 30s | Max:  5m 30s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 11s | Avg:  4m 43s | Max:  5m 37s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 48s | Avg:  5m 48s | Max:  5m 48s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 40s | Avg:  5m 40s | Max:  5m 40s
  🟩 GCC12              Pass: 100%/3   | Total: 25m 38s | Avg:  8m 32s | Max: 15m 50s
  🟩 GCC13              Pass: 100%/8   | Total:  2h 01m | Avg: 15m 09s | Max: 31m 13s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 49s | Avg:  6m 49s | Max:  6m 49s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 29s | Avg: 15m 29s | Max: 15m 29s | Hits:  99%/781   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 12m 05s | Avg: 12m 05s | Max: 12m 05s | Hits:  99%/781   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 26m 30s | Avg: 13m 15s | Max: 13m 43s | Hits:  99%/1562  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 18m 36s | Avg:  9m 18s | Max:  9m 23s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 26m | Avg:  7m 43s | Max: 31m 24s
  🟩 GCC                Pass: 100%/21  | Total:  3h 16m | Avg:  9m 22s | Max: 31m 13s
  🟩 Intel              Pass: 100%/1   | Total:  6m 49s | Avg:  6m 49s | Max:  6m 49s
  🟩 MSVC               Pass: 100%/4   | Total: 54m 04s | Avg: 13m 31s | Max: 15m 29s | Hits:  99%/3124  
  🟩 NVHPC              Pass: 100%/2   | Total: 18m 36s | Avg:  9m 18s | Max:  9m 23s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 01s | Avg: 10m 00s | Max: 15m 50s
  🟩 v100               Pass: 100%/45  | Total:  6h 43m | Avg:  8m 57s | Max: 31m 24s | Hits:  99%/3124  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 13m | Avg:  6m 20s | Max: 15m 29s | Hits:  99%/3124  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 24m 41s | Avg: 24m 41s | Max: 24m 41s
  🟩 GraphCapture       Pass: 100%/1   | Total: 27m 30s | Avg: 27m 30s | Max: 27m 30s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 03m | Avg: 21m 13s | Max: 31m 24s
  🟩 TestGPU            Pass: 100%/2   | Total: 53m 48s | Avg: 26m 54s | Max: 31m 13s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 20m 01s | Avg: 10m 00s | Max: 15m 50s
  🟩 90a                Pass: 100%/1   | Total:  4m 30s | Avg:  4m 30s | Max:  4m 30s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 24m 23s | Avg:  4m 52s | Max:  6m 25s
  🟩 14                 Pass: 100%/4   | Total: 31m 28s | Avg:  7m 52s | Max: 15m 29s | Hits:  99%/781   
  🟩 17                 Pass: 100%/12  | Total:  1h 24m | Avg:  7m 03s | Max: 13m 43s | Hits:  99%/1562  
  🟩 20                 Pass: 100%/26  | Total:  4h 42m | Avg: 10m 51s | Max: 31m 24s | Hits:  99%/781

🟩 thrust: Pass: 100%/46 | Total: 6h 20m | Avg: 8m 16s | Max: 33m 45s | Hits: 99%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 18m 32s | Avg:  9m 16s | Max: 12m 27s
🟩 cpu
  🟩 amd64              Pass: 100%/44  | Total:  6h 11m | Avg:  8m 26s | Max: 33m 45s | Hits:  99%/9260  
  🟩 arm64              Pass: 100%/2   | Total:  9m 38s | Avg:  4m 49s | Max:  5m 08s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 44m 55s | Avg:  6m 25s | Max: 18m 45s | Hits:  99%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 27m 55s | Avg: 13m 57s | Max: 14m 05s
  🟩 12.6               Pass: 100%/37  | Total:  5h 07m | Avg:  8m 19s | Max: 33m 45s | Hits:  99%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 10m 08s | Avg:  5m 04s | Max:  5m 07s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 44m 55s | Avg:  6m 25s | Max: 18m 45s | Hits:  99%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 27m 55s | Avg: 13m 57s | Max: 14m 05s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  4h 57m | Avg:  8m 30s | Max: 33m 45s | Hits:  99%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 10m 08s | Avg:  5m 04s | Max:  5m 07s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 10m | Avg:  8m 25s | Max: 33m 45s | Hits:  99%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 19s | Avg:  5m 19s | Max:  6m 25s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 42s | Avg:  6m 42s | Max:  6m 42s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 15s | Avg:  5m 15s | Max:  5m 15s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 23s | Avg:  5m 23s | Max:  5m 23s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 10s | Avg:  5m 10s | Max:  5m 10s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 46s | Avg:  5m 46s | Max:  5m 46s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 32s | Avg:  5m 32s | Max:  5m 32s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 07m | Avg:  9m 36s | Max: 33m 45s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 15s | Avg:  4m 07s | Max:  4m 09s
  🟩 GCC7               Pass: 100%/2   | Total:  9m 25s | Avg:  4m 42s | Max:  5m 01s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 00s | Avg:  5m 00s | Max:  5m 00s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 45s | Avg:  4m 55s | Max:  5m 54s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 42s | Avg:  5m 42s | Max:  5m 42s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 40s | Avg:  5m 40s | Max:  5m 40s
  🟩 GCC12              Pass: 100%/1   | Total:  6m 17s | Avg:  6m 17s | Max:  6m 17s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 05m | Avg:  8m 09s | Max: 17m 03s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 58s | Avg:  6m 58s | Max:  6m 58s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 18m 45s | Avg: 18m 45s | Max: 18m 45s | Hits:  99%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 15m 05s | Avg: 15m 05s | Max: 15m 05s | Hits:  99%/1852  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 58m 19s | Avg: 19m 26s | Max: 23m 53s | Hits:  99%/5556  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 27m 55s | Avg: 13m 57s | Max: 14m 05s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 13m | Avg:  7m 01s | Max: 33m 45s
  🟩 GCC                Pass: 100%/19  | Total:  2h 00m | Avg:  6m 19s | Max: 17m 03s
  🟩 Intel              Pass: 100%/1   | Total:  6m 58s | Avg:  6m 58s | Max:  6m 58s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 32m | Avg: 18m 25s | Max: 23m 53s | Hits:  99%/9260  
  🟩 NVHPC              Pass: 100%/2   | Total: 27m 55s | Avg: 13m 57s | Max: 14m 05s
🟩 gpu
  🟩 v100               Pass: 100%/46  | Total:  6h 20m | Avg:  8m 16s | Max: 33m 45s | Hits:  99%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 37m | Avg:  6m 56s | Max: 18m 45s | Hits:  99%/7408  
  🟩 TestCPU            Pass: 100%/3   | Total: 39m 40s | Avg: 13m 13s | Max: 23m 53s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 03m | Avg: 21m 05s | Max: 33m 45s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 28s | Avg:  4m 28s | Max:  4m 28s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 22m 32s | Avg:  4m 30s | Max:  5m 50s
  🟩 14                 Pass: 100%/4   | Total: 34m 17s | Avg:  8m 34s | Max: 18m 45s | Hits:  99%/1852  
  🟩 17                 Pass: 100%/12  | Total:  1h 36m | Avg:  8m 03s | Max: 17m 03s | Hits:  99%/3704  
  🟩 20                 Pass: 100%/23  | Total:  3h 28m | Avg:  9m 04s | Max: 33m 45s | Hits:  99%/3704

🟩 cudax: Pass: 100%/26 | Total: 2h 18m | Avg: 5m 19s | Max: 31m 25s | Hits: 92%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 07m | Avg:  5m 48s | Max: 31m 25s | Hits:  92%/312   
  🟩 arm64              Pass: 100%/4   | Total: 10m 21s | Avg:  2m 35s | Max:  2m 39s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 14m 27s | Avg:  4m 49s | Max:  8m 33s | Hits:  92%/156   
  🟩 12.5               Pass: 100%/2   | Total: 10m 57s | Avg:  5m 28s | Max:  5m 40s
  🟩 12.6               Pass: 100%/21  | Total:  1h 52m | Avg:  5m 22s | Max: 31m 25s | Hits:  92%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 14m 27s | Avg:  4m 49s | Max:  8m 33s | Hits:  92%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 10m 57s | Avg:  5m 28s | Max:  5m 40s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 52m | Avg:  5m 22s | Max: 31m 25s | Hits:  92%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 18m | Avg:  5m 19s | Max: 31m 25s | Hits:  92%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 03s | Avg:  3m 03s | Max:  3m 03s
  🟩 Clang10            Pass: 100%/1   | Total:  4m 03s | Avg:  4m 03s | Max:  4m 03s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 07s | Avg:  3m 07s | Max:  3m 07s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 17s | Avg:  3m 17s | Max:  3m 17s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 33s | Avg:  3m 33s | Max:  3m 33s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 14s | Avg:  3m 14s | Max:  3m 14s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 12s | Avg:  3m 12s | Max:  3m 12s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 16s | Avg:  3m 16s | Max:  3m 16s
  🟩 Clang18            Pass: 100%/4   | Total: 39m 45s | Avg:  9m 56s | Max: 31m 25s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 51s | Avg:  2m 51s | Max:  2m 51s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 23s | Avg:  3m 23s | Max:  3m 23s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 03s | Avg:  3m 03s | Max:  3m 03s
  🟩 GCC12              Pass: 100%/2   | Total: 20m 10s | Avg: 10m 05s | Max: 16m 46s
  🟩 GCC13              Pass: 100%/4   | Total: 10m 56s | Avg:  2m 44s | Max:  2m 58s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 33s | Avg:  8m 33s | Max:  8m 33s | Hits:  92%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 39s | Avg:  8m 39s | Max:  8m 39s | Hits:  92%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 10m 57s | Avg:  5m 28s | Max:  5m 40s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total:  1h 09m | Avg:  5m 21s | Max: 31m 25s
  🟩 GCC                Pass: 100%/9   | Total: 40m 23s | Avg:  4m 29s | Max: 16m 46s
  🟩 MSVC               Pass: 100%/2   | Total: 17m 12s | Avg:  8m 36s | Max:  8m 39s | Hits:  92%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 10m 57s | Avg:  5m 28s | Max:  5m 40s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 18m | Avg:  5m 19s | Max: 31m 25s | Hits:  92%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 30m | Avg:  3m 45s | Max:  8m 39s | Hits:  92%/312   
  🟩 Test               Pass: 100%/2   | Total: 48m 11s | Avg: 24m 05s | Max: 31m 25s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 58s | Avg:  2m 58s | Max:  2m 58s
  🟩 90a                Pass: 100%/1   | Total:  2m 45s | Avg:  2m 45s | Max:  2m 45s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 19m 42s | Avg:  3m 17s | Max:  5m 40s
  🟩 20                 Pass: 100%/20  | Total:  1h 58m | Avg:  5m 55s | Max: 31m 25s | Hits:  92%/312

🟩 cccl: Pass: 100%/6 | Total: 27m 15s | Avg: 4m 32s | Max: 4m 51s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 27m 15s | Avg:  4m 32s | Max:  4m 51s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  8m 47s | Avg:  4m 23s | Max:  4m 51s
  🟩 12.0               Pass: 100%/2   | Total:  9m 26s | Avg:  4m 43s | Max:  4m 45s
  🟩 12.6               Pass: 100%/2   | Total:  9m 02s | Avg:  4m 31s | Max:  4m 49s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  8m 47s | Avg:  4m 23s | Max:  4m 51s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  9m 26s | Avg:  4m 43s | Max:  4m 45s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 02s | Avg:  4m 31s | Max:  4m 49s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 27m 15s | Avg:  4m 32s | Max:  4m 51s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 51s | Avg:  4m 51s | Max:  4m 51s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 41s | Avg:  4m 41s | Max:  4m 41s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 49s | Avg:  4m 49s | Max:  4m 49s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 56s | Avg:  3m 56s | Max:  3m 56s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 45s | Avg:  4m 45s | Max:  4m 45s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 13s | Avg:  4m 13s | Max:  4m 13s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 14m 21s | Avg:  4m 47s | Max:  4m 51s
  🟩 GCC                Pass: 100%/3   | Total: 12m 54s | Avg:  4m 18s | Max:  4m 45s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 27m 15s | Avg:  4m 32s | Max:  4m 51s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 27m 15s | Avg:  4m 32s | Max:  4m 51s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 04s | Avg: 5m 02s | Max: 8m 04s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  8m 04s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 00s | Avg:  2m 00s | Max:  2m 00s
  🟩 Test               Pass: 100%/1   | Total:  8m 04s | Avg:  8m 04s | Max:  8m 04s

🟩 python: Pass: 100%/1 | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 176)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

rwgk · 2024-12-28T06:20:52Z

/ok to test

github-actions · 2024-12-28T07:14:14Z

🟩 CI finished in 51m 49s: Pass: 100%/176 | Total: 1d 00h | Avg: 8m 31s | Max: 45m 40s | Hits: 94%/22530

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 47m | Avg: 9m 43s | Max: 28m 40s | Hits: 87%/9814

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total:  7h 40m | Avg: 10m 00s | Max: 28m 40s | Hits:  87%/9814  
  🟩 arm64              Pass: 100%/2   | Total:  6m 54s | Avg:  3m 27s | Max:  3m 37s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 47m 12s | Avg:  6m 44s | Max: 21m 01s | Hits:  98%/2239  
  🟩 12.5               Pass: 100%/2   | Total: 33m 42s | Avg: 16m 51s | Max: 24m 39s
  🟩 12.6               Pass: 100%/39  | Total:  6h 26m | Avg:  9m 54s | Max: 28m 40s | Hits:  84%/7575  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 06m | Avg: 16m 35s | Max: 20m 27s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 47m 12s | Avg:  6m 44s | Max: 21m 01s | Hits:  98%/2239  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 33m 42s | Avg: 16m 51s | Max: 24m 39s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  5h 19m | Avg:  9m 08s | Max: 28m 40s | Hits:  84%/7575  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 06m | Avg: 16m 35s | Max: 20m 27s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 40m | Avg:  9m 06s | Max: 28m 40s | Hits:  87%/9814  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 14m 54s | Avg:  3m 43s | Max:  4m 35s
  🟩 Clang10            Pass: 100%/1   | Total:  5m 06s | Avg:  5m 06s | Max:  5m 06s
  🟩 Clang11            Pass: 100%/1   | Total:  4m 01s | Avg:  4m 01s | Max:  4m 01s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 07s | Avg:  4m 07s | Max:  4m 07s
  🟩 Clang13            Pass: 100%/1   | Total: 15m 54s | Avg: 15m 54s | Max: 15m 54s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 00s | Avg:  4m 00s | Max:  4m 00s
  🟩 Clang15            Pass: 100%/1   | Total:  4m 11s | Avg:  4m 11s | Max:  4m 11s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 18s | Avg:  4m 18s | Max:  4m 18s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 34s | Avg:  4m 34s | Max:  4m 34s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 42m | Avg: 12m 50s | Max: 23m 58s
  🟩 GCC6               Pass: 100%/2   | Total:  5m 33s | Avg:  2m 46s | Max:  2m 55s
  🟩 GCC7               Pass: 100%/2   | Total:  6m 25s | Avg:  3m 12s | Max:  3m 13s
  🟩 GCC8               Pass: 100%/1   | Total:  3m 42s | Avg:  3m 42s | Max:  3m 42s
  🟩 GCC9               Pass: 100%/3   | Total: 18m 04s | Avg:  6m 01s | Max: 11m 46s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 51s | Avg:  3m 51s | Max:  3m 51s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 57s | Avg:  3m 57s | Max:  3m 57s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 06s | Avg:  4m 06s | Max:  4m 06s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 20m | Avg: 14m 04s | Max: 28m 40s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 02s | Avg:  6m 02s | Max:  6m 02s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 21m 01s | Avg: 21m 01s | Max: 21m 01s | Hits:  98%/2239  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 27m 59s | Avg: 27m 59s | Max: 27m 59s | Hits:  53%/2476  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 28m 05s | Avg: 14m 02s | Max: 14m 15s | Hits:  98%/5099  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 33m 42s | Avg: 16m 51s | Max: 24m 39s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  2h 43m | Avg:  8m 11s | Max: 23m 58s
  🟩 GCC                Pass: 100%/21  | Total:  3h 06m | Avg:  8m 52s | Max: 28m 40s
  🟩 Intel              Pass: 100%/1   | Total:  6m 02s | Avg:  6m 02s | Max:  6m 02s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 17m | Avg: 19m 16s | Max: 27m 59s | Hits:  87%/9814  
  🟩 NVHPC              Pass: 100%/2   | Total: 33m 42s | Avg: 16m 51s | Max: 24m 39s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total:  7h 47m | Avg:  9m 43s | Max: 28m 40s | Hits:  87%/9814  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total:  5h 17m | Avg:  7m 44s | Max: 27m 59s | Hits:  87%/9814  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 46m | Avg: 26m 30s | Max: 28m 40s
  🟩 Test               Pass: 100%/2   | Total: 41m 40s | Avg: 20m 50s | Max: 23m 58s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 57s | Avg:  1m 57s | Max:  1m 57s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 12m 34s | Avg: 12m 34s | Max: 12m 34s
  🟩 90a                Pass: 100%/2   | Total: 17m 20s | Avg:  8m 40s | Max: 13m 25s
🟩 std
  🟩 11                 Pass: 100%/6   | Total: 39m 39s | Avg:  6m 36s | Max: 24m 24s
  🟩 14                 Pass: 100%/5   | Total: 57m 15s | Avg: 11m 27s | Max: 25m 31s | Hits:  98%/2239  
  🟩 17                 Pass: 100%/13  | Total:  2h 20m | Avg: 10m 49s | Max: 27m 59s | Hits:  76%/4952  
  🟩 20                 Pass: 100%/23  | Total:  3h 47m | Avg:  9m 53s | Max: 28m 40s | Hits:  98%/2623

🟩 cub: Pass: 100%/47 | Total: 7h 14m | Avg: 9m 14s | Max: 36m 31s | Hits: 99%/3144

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  7h 04m | Avg:  9m 26s | Max: 36m 31s | Hits:  99%/3144  
  🟩 arm64              Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  5m 02s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 42m 21s | Avg:  6m 03s | Max: 16m 03s | Hits:  99%/786   
  🟩 12.5               Pass: 100%/2   | Total: 19m 05s | Avg:  9m 32s | Max:  9m 36s
  🟩 12.6               Pass: 100%/38  | Total:  6h 12m | Avg:  9m 48s | Max: 36m 31s | Hits:  99%/2358  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 49s | Avg:  4m 24s | Max:  4m 29s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 42m 21s | Avg:  6m 03s | Max: 16m 03s | Hits:  99%/786   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 19m 05s | Avg:  9m 32s | Max:  9m 36s
  🟩 nvcc12.6           Pass: 100%/36  | Total:  6h 04m | Avg: 10m 06s | Max: 36m 31s | Hits:  99%/2358  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 49s | Avg:  4m 24s | Max:  4m 29s
  🟩 nvcc               Pass: 100%/45  | Total:  7h 05m | Avg:  9m 27s | Max: 36m 31s | Hits:  99%/3144  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 12s | Avg:  5m 18s | Max:  6m 17s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 57s | Avg:  6m 57s | Max:  6m 57s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 17s | Avg:  5m 17s | Max:  5m 17s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 22s | Avg:  5m 22s | Max:  5m 22s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 40s | Avg:  5m 40s | Max:  5m 40s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 31s | Avg:  5m 31s | Max:  5m 31s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 39s | Avg:  5m 39s | Max:  5m 39s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 23s | Avg:  5m 23s | Max:  5m 23s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 19m | Avg: 11m 23s | Max: 36m 31s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 47s | Avg:  4m 23s | Max:  4m 33s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 50s | Avg:  5m 25s | Max:  5m 32s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 22s | Avg:  5m 22s | Max:  5m 22s
  🟩 GCC9               Pass: 100%/3   | Total: 13m 55s | Avg:  4m 38s | Max:  5m 24s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 GCC12              Pass: 100%/3   | Total: 26m 11s | Avg:  8m 43s | Max: 16m 02s
  🟩 GCC13              Pass: 100%/8   | Total:  2h 08m | Avg: 16m 04s | Max: 34m 04s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 37s | Avg:  6m 37s | Max:  6m 37s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 03s | Avg: 16m 03s | Max: 16m 03s | Hits:  99%/786   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 13m 05s | Avg: 13m 05s | Max: 13m 05s | Hits:  99%/786   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 28m 26s | Avg: 14m 13s | Max: 15m 05s | Hits:  99%/1572  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 19m 05s | Avg:  9m 32s | Max:  9m 36s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 26m | Avg:  7m 42s | Max: 36m 31s
  🟩 GCC                Pass: 100%/21  | Total:  3h 24m | Avg:  9m 45s | Max: 34m 04s
  🟩 Intel              Pass: 100%/1   | Total:  6m 37s | Avg:  6m 37s | Max:  6m 37s
  🟩 MSVC               Pass: 100%/4   | Total: 57m 34s | Avg: 14m 23s | Max: 16m 03s | Hits:  99%/3144  
  🟩 NVHPC              Pass: 100%/2   | Total: 19m 05s | Avg:  9m 32s | Max:  9m 36s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 14s | Avg: 10m 07s | Max: 16m 02s
  🟩 v100               Pass: 100%/45  | Total:  6h 54m | Avg:  9m 12s | Max: 36m 31s | Hits:  99%/3144  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 15m | Avg:  6m 23s | Max: 16m 03s | Hits:  99%/3144  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 18m 20s | Avg: 18m 20s | Max: 18m 20s
  🟩 GraphCapture       Pass: 100%/1   | Total: 26m 24s | Avg: 26m 24s | Max: 26m 24s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 03m | Avg: 21m 05s | Max: 28m 52s
  🟩 TestGPU            Pass: 100%/2   | Total:  1h 10m | Avg: 35m 17s | Max: 36m 31s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 20m 14s | Avg: 10m 07s | Max: 16m 02s
  🟩 90a                Pass: 100%/1   | Total:  4m 21s | Avg:  4m 21s | Max:  4m 21s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 24m 01s | Avg:  4m 48s | Max:  5m 55s
  🟩 14                 Pass: 100%/4   | Total: 32m 25s | Avg:  8m 06s | Max: 16m 03s | Hits:  99%/786   
  🟩 17                 Pass: 100%/12  | Total:  1h 25m | Avg:  7m 07s | Max: 13m 21s | Hits:  99%/1572  
  🟩 20                 Pass: 100%/26  | Total:  4h 52m | Avg: 11m 15s | Max: 36m 31s | Hits:  99%/786

🟩 thrust: Pass: 100%/46 | Total: 6h 31m | Avg: 8m 30s | Max: 27m 15s | Hits: 99%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 28m 45s | Avg: 14m 22s | Max: 23m 10s
🟩 cpu
  🟩 amd64              Pass: 100%/44  | Total:  6h 21m | Avg:  8m 40s | Max: 27m 15s | Hits:  99%/9260  
  🟩 arm64              Pass: 100%/2   | Total:  9m 39s | Avg:  4m 49s | Max:  5m 06s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 43m 34s | Avg:  6m 13s | Max: 18m 26s | Hits:  99%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 29m 22s | Avg: 14m 41s | Max: 15m 41s
  🟩 12.6               Pass: 100%/37  | Total:  5h 18m | Avg:  8m 36s | Max: 27m 15s | Hits:  99%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 10m 13s | Avg:  5m 06s | Max:  5m 13s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 43m 34s | Avg:  6m 13s | Max: 18m 26s | Hits:  99%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 29m 22s | Avg: 14m 41s | Max: 15m 41s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  5h 08m | Avg:  8m 48s | Max: 27m 15s | Hits:  99%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 10m 13s | Avg:  5m 06s | Max:  5m 13s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 21m | Avg:  8m 39s | Max: 27m 15s | Hits:  99%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 20m 44s | Avg:  5m 11s | Max:  5m 58s
  🟩 Clang10            Pass: 100%/1   | Total:  7m 05s | Avg:  7m 05s | Max:  7m 05s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 28s | Avg:  5m 28s | Max:  5m 28s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 38s | Avg:  5m 38s | Max:  5m 38s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 18s | Avg:  5m 18s | Max:  5m 18s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 18s | Avg:  5m 18s | Max:  5m 18s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 25s | Avg:  5m 25s | Max:  5m 25s
  🟩 Clang18            Pass: 100%/7   | Total: 58m 22s | Avg:  8m 20s | Max: 25m 52s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 53s | Avg:  3m 56s | Max:  4m 03s
  🟩 GCC7               Pass: 100%/2   | Total:  9m 40s | Avg:  4m 50s | Max:  5m 01s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 29s | Avg:  5m 29s | Max:  5m 29s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 20s | Avg:  4m 46s | Max:  5m 55s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 22s | Avg:  5m 22s | Max:  5m 22s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 24s | Avg:  5m 24s | Max:  5m 24s
  🟩 GCC12              Pass: 100%/1   | Total:  5m 56s | Avg:  5m 56s | Max:  5m 56s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 25m | Avg: 10m 40s | Max: 27m 15s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  7m 00s | Avg:  7m 00s | Max:  7m 00s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 18m 26s | Avg: 18m 26s | Max: 18m 26s | Hits:  99%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 15m 29s | Avg: 15m 29s | Max: 15m 29s | Hits:  99%/1852  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 57m 24s | Avg: 19m 08s | Max: 23m 10s | Hits:  99%/5556  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 29m 22s | Avg: 14m 41s | Max: 15m 41s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 04m | Avg:  6m 32s | Max: 25m 52s
  🟩 GCC                Pass: 100%/19  | Total:  2h 19m | Avg:  7m 20s | Max: 27m 15s
  🟩 Intel              Pass: 100%/1   | Total:  7m 00s | Avg:  7m 00s | Max:  7m 00s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 31m | Avg: 18m 15s | Max: 23m 10s | Hits:  99%/9260  
  🟩 NVHPC              Pass: 100%/2   | Total: 29m 22s | Avg: 14m 41s | Max: 15m 41s
🟩 gpu
  🟩 v100               Pass: 100%/46  | Total:  6h 31m | Avg:  8m 30s | Max: 27m 15s | Hits:  99%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 37m | Avg:  6m 55s | Max: 18m 26s | Hits:  99%/7408  
  🟩 TestCPU            Pass: 100%/3   | Total: 37m 55s | Avg: 12m 38s | Max: 23m 10s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 16m | Avg: 25m 25s | Max: 27m 15s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 47s | Avg:  4m 47s | Max:  4m 47s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 22m 33s | Avg:  4m 30s | Max:  5m 58s
  🟩 14                 Pass: 100%/4   | Total: 33m 26s | Avg:  8m 21s | Max: 18m 26s | Hits:  99%/1852  
  🟩 17                 Pass: 100%/12  | Total:  1h 36m | Avg:  8m 04s | Max: 16m 24s | Hits:  99%/3704  
  🟩 20                 Pass: 100%/23  | Total:  3h 29m | Avg:  9m 07s | Max: 27m 15s | Hits:  99%/3704

🟩 cudax: Pass: 100%/26 | Total: 2h 07m | Avg: 4m 53s | Max: 19m 50s | Hits: 92%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  1h 57m | Avg:  5m 19s | Max: 19m 50s | Hits:  92%/312   
  🟩 arm64              Pass: 100%/4   | Total: 10m 18s | Avg:  2m 34s | Max:  2m 39s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 14m 48s | Avg:  4m 56s | Max:  8m 58s | Hits:  92%/156   
  🟩 12.5               Pass: 100%/2   | Total: 10m 55s | Avg:  5m 27s | Max:  5m 35s
  🟩 12.6               Pass: 100%/21  | Total:  1h 41m | Avg:  4m 50s | Max: 19m 50s | Hits:  92%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 14m 48s | Avg:  4m 56s | Max:  8m 58s | Hits:  92%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 10m 55s | Avg:  5m 27s | Max:  5m 35s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 41m | Avg:  4m 50s | Max: 19m 50s | Hits:  92%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 07m | Avg:  4m 53s | Max: 19m 50s | Hits:  92%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  2m 59s | Avg:  2m 59s | Max:  2m 59s
  🟩 Clang10            Pass: 100%/1   | Total:  3m 33s | Avg:  3m 33s | Max:  3m 33s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 12s | Avg:  3m 12s | Max:  3m 12s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 19s | Avg:  3m 19s | Max:  3m 19s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 17s | Avg:  3m 17s | Max:  3m 17s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 30s | Avg:  3m 30s | Max:  3m 30s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 28s | Avg:  3m 28s | Max:  3m 28s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 23s | Avg:  3m 23s | Max:  3m 23s
  🟩 Clang18            Pass: 100%/4   | Total: 25m 19s | Avg:  6m 19s | Max: 16m 53s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 51s | Avg:  2m 51s | Max:  2m 51s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 12s | Avg:  3m 12s | Max:  3m 12s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 14s | Avg:  3m 14s | Max:  3m 14s
  🟩 GCC12              Pass: 100%/2   | Total: 23m 01s | Avg: 11m 30s | Max: 19m 50s
  🟩 GCC13              Pass: 100%/4   | Total: 10m 53s | Avg:  2m 43s | Max:  2m 58s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 58s | Avg:  8m 58s | Max:  8m 58s | Hits:  92%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  9m 04s | Avg:  9m 04s | Max:  9m 04s | Hits:  92%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 10m 55s | Avg:  5m 27s | Max:  5m 35s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total: 55m 13s | Avg:  4m 14s | Max: 16m 53s
  🟩 GCC                Pass: 100%/9   | Total: 43m 11s | Avg:  4m 47s | Max: 19m 50s
  🟩 MSVC               Pass: 100%/2   | Total: 18m 02s | Avg:  9m 01s | Max:  9m 04s | Hits:  92%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 10m 55s | Avg:  5m 27s | Max:  5m 35s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 07m | Avg:  4m 53s | Max: 19m 50s | Hits:  92%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 30m | Avg:  3m 46s | Max:  9m 04s | Hits:  92%/312   
  🟩 Test               Pass: 100%/2   | Total: 36m 43s | Avg: 18m 21s | Max: 19m 50s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s
  🟩 90a                Pass: 100%/1   | Total:  2m 58s | Avg:  2m 58s | Max:  2m 58s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 19m 13s | Avg:  3m 12s | Max:  5m 35s
  🟩 20                 Pass: 100%/20  | Total:  1h 48m | Avg:  5m 24s | Max: 19m 50s | Hits:  92%/312

🟩 cccl: Pass: 100%/6 | Total: 24m 24s | Avg: 4m 04s | Max: 4m 35s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 24m 24s | Avg:  4m 04s | Max:  4m 35s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 17s | Avg:  3m 38s | Max:  3m 44s
  🟩 12.0               Pass: 100%/2   | Total:  8m 27s | Avg:  4m 13s | Max:  4m 21s
  🟩 12.6               Pass: 100%/2   | Total:  8m 40s | Avg:  4m 20s | Max:  4m 35s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 17s | Avg:  3m 38s | Max:  3m 44s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  8m 27s | Avg:  4m 13s | Max:  4m 21s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  8m 40s | Avg:  4m 20s | Max:  4m 35s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 24m 24s | Avg:  4m 04s | Max:  4m 35s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 44s | Avg:  3m 44s | Max:  3m 44s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 21s | Avg:  4m 21s | Max:  4m 21s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 35s | Avg:  4m 35s | Max:  4m 35s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 33s | Avg:  3m 33s | Max:  3m 33s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 06s | Avg:  4m 06s | Max:  4m 06s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 05s | Avg:  4m 05s | Max:  4m 05s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 12m 40s | Avg:  4m 13s | Max:  4m 35s
  🟩 GCC                Pass: 100%/3   | Total: 11m 44s | Avg:  3m 54s | Max:  4m 06s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 24m 24s | Avg:  4m 04s | Max:  4m 35s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 24m 24s | Avg:  4m 04s | Max:  4m 35s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 34s | Avg: 4m 47s | Max: 7m 31s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  7m 31s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  7m 31s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  7m 31s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  7m 31s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  7m 31s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  7m 31s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  7m 31s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 03s | Avg:  2m 03s | Max:  2m 03s
  🟩 Test               Pass: 100%/1   | Total:  7m 31s | Avg:  7m 31s | Max:  7m 31s

🟩 python: Pass: 100%/1 | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 176)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

…pyproject.toml

rwgk · 2024-12-28T08:01:18Z

/ok to test

github-actions · 2024-12-28T08:53:12Z

🟩 CI finished in 50m 26s: Pass: 100%/176 | Total: 1d 00h | Avg: 8m 25s | Max: 44m 32s | Hits: 99%/22530

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 12m | Avg: 9m 01s | Max: 27m 15s | Hits: 99%/9814

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total:  7h 06m | Avg:  9m 15s | Max: 27m 15s | Hits:  99%/9814  
  🟩 arm64              Pass: 100%/2   | Total:  6m 57s | Avg:  3m 28s | Max:  3m 35s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 37m 09s | Avg:  5m 18s | Max: 19m 51s | Hits:  98%/2239  
  🟩 12.5               Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  9m 02s
  🟩 12.6               Pass: 100%/39  | Total:  6h 18m | Avg:  9m 42s | Max: 27m 15s | Hits:  99%/7575  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 06m | Avg: 16m 40s | Max: 20m 06s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 37m 09s | Avg:  5m 18s | Max: 19m 51s | Hits:  98%/2239  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  9m 02s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  5h 11m | Avg:  8m 54s | Max: 27m 15s | Hits:  99%/7575  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 06m | Avg: 16m 40s | Max: 20m 06s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 06m | Avg:  8m 19s | Max: 27m 15s | Hits:  99%/9814  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 15m 44s | Avg:  3m 56s | Max:  4m 45s
  🟩 Clang10            Pass: 100%/1   | Total:  5m 08s | Avg:  5m 08s | Max:  5m 08s
  🟩 Clang11            Pass: 100%/1   | Total:  4m 16s | Avg:  4m 16s | Max:  4m 16s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 53s | Avg:  3m 53s | Max:  3m 53s
  🟩 Clang13            Pass: 100%/1   | Total:  4m 06s | Avg:  4m 06s | Max:  4m 06s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 11s | Avg:  4m 11s | Max:  4m 11s
  🟩 Clang15            Pass: 100%/1   | Total:  4m 25s | Avg:  4m 25s | Max:  4m 25s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 08s | Avg:  4m 08s | Max:  4m 08s
  🟩 Clang17            Pass: 100%/1   | Total: 16m 39s | Avg: 16m 39s | Max: 16m 39s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 45m | Avg: 13m 14s | Max: 26m 49s
  🟩 GCC6               Pass: 100%/2   | Total:  5m 06s | Avg:  2m 33s | Max:  2m 38s
  🟩 GCC7               Pass: 100%/2   | Total:  6m 39s | Avg:  3m 19s | Max:  3m 23s
  🟩 GCC8               Pass: 100%/1   | Total:  3m 51s | Avg:  3m 51s | Max:  3m 51s
  🟩 GCC9               Pass: 100%/3   | Total:  9m 15s | Avg:  3m 05s | Max:  3m 51s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 53s | Avg:  3m 53s | Max:  3m 53s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 38s | Avg:  3m 38s | Max:  3m 38s
  🟩 GCC12              Pass: 100%/1   | Total:  3m 59s | Avg:  3m 59s | Max:  3m 59s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 22m | Avg: 14m 13s | Max: 27m 15s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  5m 57s | Avg:  5m 57s | Max:  5m 57s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 19m 51s | Avg: 19m 51s | Max: 19m 51s | Hits:  98%/2239  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 13m 29s | Avg: 13m 29s | Max: 13m 29s | Hits:  99%/2476  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 29m 14s | Avg: 14m 37s | Max: 15m 37s | Hits:  98%/5099  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  9m 02s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  2h 48m | Avg:  8m 25s | Max: 26m 49s
  🟩 GCC                Pass: 100%/21  | Total:  2h 58m | Avg:  8m 30s | Max: 27m 15s
  🟩 Intel              Pass: 100%/1   | Total:  5m 57s | Avg:  5m 57s | Max:  5m 57s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 02m | Avg: 15m 38s | Max: 19m 51s | Hits:  99%/9814  
  🟩 NVHPC              Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  9m 02s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total:  7h 12m | Avg:  9m 01s | Max: 27m 15s | Hits:  99%/9814  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total:  4h 39m | Avg:  6m 48s | Max: 20m 06s | Hits:  99%/9814  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 38m | Avg: 24m 38s | Max: 27m 15s
  🟩 Test               Pass: 100%/2   | Total: 53m 21s | Avg: 26m 40s | Max: 26m 49s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 02s | Avg:  2m 02s | Max:  2m 02s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 13m 49s | Avg: 13m 49s | Max: 13m 49s
  🟩 90a                Pass: 100%/2   | Total: 16m 49s | Avg:  8m 24s | Max: 12m 50s
🟩 std
  🟩 11                 Pass: 100%/6   | Total: 39m 28s | Avg:  6m 34s | Max: 23m 56s
  🟩 14                 Pass: 100%/5   | Total: 55m 30s | Avg: 11m 06s | Max: 24m 53s | Hits:  98%/2239  
  🟩 17                 Pass: 100%/13  | Total:  1h 51m | Avg:  8m 35s | Max: 22m 29s | Hits:  99%/4952  
  🟩 20                 Pass: 100%/23  | Total:  3h 44m | Avg:  9m 44s | Max: 27m 15s | Hits:  98%/2623

🟩 cub: Pass: 100%/47 | Total: 7h 24m | Avg: 9m 27s | Max: 36m 19s | Hits: 99%/3144

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  7h 14m | Avg:  9m 39s | Max: 36m 19s | Hits:  99%/3144  
  🟩 arm64              Pass: 100%/2   | Total:  9m 39s | Avg:  4m 49s | Max:  5m 00s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 42m 09s | Avg:  6m 01s | Max: 16m 10s | Hits:  99%/786   
  🟩 12.5               Pass: 100%/2   | Total: 19m 00s | Avg:  9m 30s | Max:  9m 38s
  🟩 12.6               Pass: 100%/38  | Total:  6h 23m | Avg: 10m 05s | Max: 36m 19s | Hits:  99%/2358  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 48s | Avg:  4m 24s | Max:  4m 31s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 42m 09s | Avg:  6m 01s | Max: 16m 10s | Hits:  99%/786   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 19m 00s | Avg:  9m 30s | Max:  9m 38s
  🟩 nvcc12.6           Pass: 100%/36  | Total:  6h 14m | Avg: 10m 24s | Max: 36m 19s | Hits:  99%/2358  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 48s | Avg:  4m 24s | Max:  4m 31s
  🟩 nvcc               Pass: 100%/45  | Total:  7h 15m | Avg:  9m 40s | Max: 36m 19s | Hits:  99%/3144  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 25s | Avg:  5m 21s | Max:  6m 25s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 51s | Avg:  6m 51s | Max:  6m 51s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 38s | Avg:  5m 38s | Max:  5m 38s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 29s | Avg:  5m 29s | Max:  5m 29s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 49s | Avg:  5m 49s | Max:  5m 49s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 53s | Avg:  5m 53s | Max:  5m 53s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 40s | Avg:  5m 40s | Max:  5m 40s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 37s | Avg:  5m 37s | Max:  5m 37s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 28m | Avg: 12m 41s | Max: 36m 19s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 22s | Avg:  4m 11s | Max:  4m 20s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 38s | Avg:  5m 19s | Max:  5m 25s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 17s | Avg:  5m 17s | Max:  5m 17s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 20s | Avg:  4m 46s | Max:  5m 37s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 52s | Avg:  5m 52s | Max:  5m 52s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 44s | Avg:  5m 44s | Max:  5m 44s
  🟩 GCC12              Pass: 100%/3   | Total: 33m 11s | Avg: 11m 03s | Max: 22m 35s
  🟩 GCC13              Pass: 100%/8   | Total:  2h 00m | Avg: 15m 03s | Max: 27m 58s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 59s | Avg:  6m 59s | Max:  6m 59s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 10s | Avg: 16m 10s | Max: 16m 10s | Hits:  99%/786   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 13m 18s | Avg: 13m 18s | Max: 13m 18s | Hits:  99%/786   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 28m 28s | Avg: 14m 14s | Max: 14m 14s | Hits:  99%/1572  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 19m 00s | Avg:  9m 30s | Max:  9m 38s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 36m | Avg:  8m 14s | Max: 36m 19s
  🟩 GCC                Pass: 100%/21  | Total:  3h 23m | Avg:  9m 42s | Max: 27m 58s
  🟩 Intel              Pass: 100%/1   | Total:  6m 59s | Avg:  6m 59s | Max:  6m 59s
  🟩 MSVC               Pass: 100%/4   | Total: 57m 56s | Avg: 14m 29s | Max: 16m 10s | Hits:  99%/3144  
  🟩 NVHPC              Pass: 100%/2   | Total: 19m 00s | Avg:  9m 30s | Max:  9m 38s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 27m 03s | Avg: 13m 31s | Max: 22m 35s
  🟩 v100               Pass: 100%/45  | Total:  6h 57m | Avg:  9m 16s | Max: 36m 19s | Hits:  99%/3144  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 17m | Avg:  6m 26s | Max: 16m 10s | Hits:  99%/3144  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 24m 25s | Avg: 24m 25s | Max: 24m 25s
  🟩 GraphCapture       Pass: 100%/1   | Total: 19m 40s | Avg: 19m 40s | Max: 19m 40s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 18m | Avg: 26m 16s | Max: 28m 17s
  🟩 TestGPU            Pass: 100%/2   | Total:  1h 03m | Avg: 31m 50s | Max: 36m 19s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 27m 03s | Avg: 13m 31s | Max: 22m 35s
  🟩 90a                Pass: 100%/1   | Total:  4m 20s | Avg:  4m 20s | Max:  4m 20s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 23m 31s | Avg:  4m 42s | Max:  6m 06s
  🟩 14                 Pass: 100%/4   | Total: 32m 20s | Avg:  8m 05s | Max: 16m 10s | Hits:  99%/786   
  🟩 17                 Pass: 100%/12  | Total:  1h 26m | Avg:  7m 13s | Max: 14m 14s | Hits:  99%/1572  
  🟩 20                 Pass: 100%/26  | Total:  5h 01m | Avg: 11m 36s | Max: 36m 19s | Hits:  99%/786

🟩 thrust: Pass: 100%/46 | Total: 6h 37m | Avg: 8m 38s | Max: 32m 50s | Hits: 99%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 20m 22s | Avg: 10m 11s | Max: 14m 02s
🟩 cpu
  🟩 amd64              Pass: 100%/44  | Total:  6h 27m | Avg:  8m 48s | Max: 32m 50s | Hits:  99%/9260  
  🟩 arm64              Pass: 100%/2   | Total:  9m 36s | Avg:  4m 48s | Max:  5m 10s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total:  1h 13m | Avg: 10m 31s | Max: 32m 50s | Hits:  99%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 29m 04s | Avg: 14m 32s | Max: 15m 14s
  🟩 12.6               Pass: 100%/37  | Total:  4h 54m | Avg:  7m 57s | Max: 22m 45s | Hits:  99%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  5m 17s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 13m | Avg: 10m 31s | Max: 32m 50s | Hits:  99%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 29m 04s | Avg: 14m 32s | Max: 15m 14s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  4h 44m | Avg:  8m 07s | Max: 22m 45s | Hits:  99%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  5m 17s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 27m | Avg:  8m 47s | Max: 32m 50s | Hits:  99%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 20m 58s | Avg:  5m 14s | Max:  6m 13s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 24s | Avg:  6m 24s | Max:  6m 24s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 28s | Avg:  5m 28s | Max:  5m 28s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 32s | Avg:  5m 32s | Max:  5m 32s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 25s | Avg:  5m 25s | Max:  5m 25s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 14s | Avg:  5m 14s | Max:  5m 14s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 49s | Avg:  5m 49s | Max:  5m 49s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 44s | Avg:  5m 44s | Max:  5m 44s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 15s | Avg:  5m 15s | Max:  5m 15s
  🟩 Clang18            Pass: 100%/7   | Total: 44m 35s | Avg:  6m 22s | Max: 11m 27s
  🟩 GCC6               Pass: 100%/2   | Total: 36m 40s | Avg: 18m 20s | Max: 32m 50s
  🟩 GCC7               Pass: 100%/2   | Total:  9m 32s | Avg:  4m 46s | Max:  5m 05s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 16s | Avg:  5m 16s | Max:  5m 16s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 10s | Avg:  4m 43s | Max:  5m 47s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 44s | Avg:  5m 44s | Max:  5m 44s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 33s | Avg:  5m 33s | Max:  5m 33s
  🟩 GCC12              Pass: 100%/1   | Total:  6m 00s | Avg:  6m 00s | Max:  6m 00s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 13m | Avg:  9m 12s | Max: 22m 45s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  7m 02s | Avg:  7m 02s | Max:  7m 02s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 19m 36s | Avg: 19m 36s | Max: 19m 36s | Hits:  99%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 17m 50s | Avg: 17m 50s | Max: 17m 50s | Hits:  99%/1852  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 56m 50s | Avg: 18m 56s | Max: 22m 10s | Hits:  99%/5556  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 29m 04s | Avg: 14m 32s | Max: 15m 14s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  1h 50m | Avg:  5m 48s | Max: 11m 27s
  🟩 GCC                Pass: 100%/19  | Total:  2h 36m | Avg:  8m 14s | Max: 32m 50s
  🟩 Intel              Pass: 100%/1   | Total:  7m 02s | Avg:  7m 02s | Max:  7m 02s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 34m | Avg: 18m 51s | Max: 22m 10s | Hits:  99%/9260  
  🟩 NVHPC              Pass: 100%/2   | Total: 29m 04s | Avg: 14m 32s | Max: 15m 14s
🟩 gpu
  🟩 v100               Pass: 100%/46  | Total:  6h 37m | Avg:  8m 38s | Max: 32m 50s | Hits:  99%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  5h 11m | Avg:  7m 47s | Max: 32m 50s | Hits:  99%/7408  
  🟩 TestCPU            Pass: 100%/3   | Total: 37m 30s | Avg: 12m 30s | Max: 22m 10s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/3   | Total: 48m 14s | Avg: 16m 04s | Max: 22m 45s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 51s | Avg:  4m 51s | Max:  4m 51s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 21m 51s | Avg:  4m 22s | Max:  5m 42s
  🟩 14                 Pass: 100%/4   | Total:  1h 03m | Avg: 15m 56s | Max: 32m 50s | Hits:  99%/1852  
  🟩 17                 Pass: 100%/12  | Total:  1h 41m | Avg:  8m 26s | Max: 17m 50s | Hits:  99%/3704  
  🟩 20                 Pass: 100%/23  | Total:  3h 10m | Avg:  8m 16s | Max: 22m 45s | Hits:  99%/3704

🟩 cudax: Pass: 100%/26 | Total: 2h 10m | Avg: 5m 02s | Max: 22m 58s | Hits: 92%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 00m | Avg:  5m 28s | Max: 22m 58s | Hits:  92%/312   
  🟩 arm64              Pass: 100%/4   | Total: 10m 36s | Avg:  2m 39s | Max:  2m 45s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 15m 03s | Avg:  5m 01s | Max:  9m 08s | Hits:  92%/156   
  🟩 12.5               Pass: 100%/2   | Total: 10m 22s | Avg:  5m 11s | Max:  5m 20s
  🟩 12.6               Pass: 100%/21  | Total:  1h 45m | Avg:  5m 01s | Max: 22m 58s | Hits:  92%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 15m 03s | Avg:  5m 01s | Max:  9m 08s | Hits:  92%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 10m 22s | Avg:  5m 11s | Max:  5m 20s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 45m | Avg:  5m 01s | Max: 22m 58s | Hits:  92%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 10m | Avg:  5m 02s | Max: 22m 58s | Hits:  92%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 00s | Avg:  3m 00s | Max:  3m 00s
  🟩 Clang10            Pass: 100%/1   | Total:  3m 24s | Avg:  3m 24s | Max:  3m 24s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 10s | Avg:  3m 10s | Max:  3m 10s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 06s | Avg:  3m 06s | Max:  3m 06s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 08s | Avg:  3m 08s | Max:  3m 08s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 23s | Avg:  3m 23s | Max:  3m 23s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 24s | Avg:  3m 24s | Max:  3m 24s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 14s | Avg:  3m 14s | Max:  3m 14s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 14s | Avg:  3m 14s | Max:  3m 14s
  🟩 Clang18            Pass: 100%/4   | Total: 31m 25s | Avg:  7m 51s | Max: 22m 58s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 55s | Avg:  2m 55s | Max:  2m 55s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 03s | Avg:  3m 03s | Max:  3m 03s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 10s | Avg:  3m 10s | Max:  3m 10s
  🟩 GCC12              Pass: 100%/2   | Total: 21m 59s | Avg: 10m 59s | Max: 18m 38s
  🟩 GCC13              Pass: 100%/4   | Total: 10m 53s | Avg:  2m 43s | Max:  2m 50s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  9m 08s | Avg:  9m 08s | Max:  9m 08s | Hits:  92%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 59s | Avg:  8m 59s | Max:  8m 59s | Hits:  92%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 10m 22s | Avg:  5m 11s | Max:  5m 20s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total:  1h 00m | Avg:  4m 39s | Max: 22m 58s
  🟩 GCC                Pass: 100%/9   | Total: 42m 00s | Avg:  4m 40s | Max: 18m 38s
  🟩 MSVC               Pass: 100%/2   | Total: 18m 07s | Avg:  9m 03s | Max:  9m 08s | Hits:  92%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 10m 22s | Avg:  5m 11s | Max:  5m 20s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 10m | Avg:  5m 02s | Max: 22m 58s | Hits:  92%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 29m | Avg:  3m 43s | Max:  9m 08s | Hits:  92%/312   
  🟩 Test               Pass: 100%/2   | Total: 41m 36s | Avg: 20m 48s | Max: 22m 58s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 43s | Avg:  2m 43s | Max:  2m 43s
  🟩 90a                Pass: 100%/1   | Total:  2m 50s | Avg:  2m 50s | Max:  2m 50s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 19m 19s | Avg:  3m 13s | Max:  5m 20s
  🟩 20                 Pass: 100%/20  | Total:  1h 51m | Avg:  5m 34s | Max: 22m 58s | Hits:  92%/312

🟩 cccl: Pass: 100%/6 | Total: 24m 14s | Avg: 4m 02s | Max: 4m 42s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 24m 14s | Avg:  4m 02s | Max:  4m 42s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  6m 57s | Avg:  3m 28s | Max:  3m 54s
  🟩 12.0               Pass: 100%/2   | Total:  8m 31s | Avg:  4m 15s | Max:  4m 24s
  🟩 12.6               Pass: 100%/2   | Total:  8m 46s | Avg:  4m 23s | Max:  4m 42s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  6m 57s | Avg:  3m 28s | Max:  3m 54s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  8m 31s | Avg:  4m 15s | Max:  4m 24s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  8m 46s | Avg:  4m 23s | Max:  4m 42s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 24m 14s | Avg:  4m 02s | Max:  4m 42s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 54s | Avg:  3m 54s | Max:  3m 54s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 24s | Avg:  4m 24s | Max:  4m 24s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 42s | Avg:  4m 42s | Max:  4m 42s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 03s | Avg:  3m 03s | Max:  3m 03s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 07s | Avg:  4m 07s | Max:  4m 07s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 04s | Avg:  4m 04s | Max:  4m 04s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 13m 00s | Avg:  4m 20s | Max:  4m 42s
  🟩 GCC                Pass: 100%/3   | Total: 11m 14s | Avg:  3m 44s | Max:  4m 07s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 24m 14s | Avg:  4m 02s | Max:  4m 42s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 24m 14s | Avg:  4m 02s | Max:  4m 42s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 24s | Avg: 4m 42s | Max: 7m 27s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total:  9m 24s | Avg:  4m 42s | Max:  7m 27s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total:  9m 24s | Avg:  4m 42s | Max:  7m 27s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 24s | Avg:  4m 42s | Max:  7m 27s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total:  9m 24s | Avg:  4m 42s | Max:  7m 27s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total:  9m 24s | Avg:  4m 42s | Max:  7m 27s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total:  9m 24s | Avg:  4m 42s | Max:  7m 27s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total:  9m 24s | Avg:  4m 42s | Max:  7m 27s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  1m 57s | Avg:  1m 57s | Max:  1m 57s
  🟩 Test               Pass: 100%/1   | Total:  7m 27s | Avg:  7m 27s | Max:  7m 27s

🟩 python: Pass: 100%/1 | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 176)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

github-actions · 2024-12-29T06:03:04Z

🟩 CI finished in 50m 37s: Pass: 100%/176 | Total: 23h 49m | Avg: 8m 07s | Max: 44m 41s | Hits: 99%/22530

🟩 libcudacxx: Pass: 100%/48 | Total: 6h 46m | Avg: 8m 28s | Max: 31m 05s | Hits: 99%/9814

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total:  6h 39m | Avg:  8m 41s | Max: 31m 05s | Hits:  99%/9814  
  🟩 arm64              Pass: 100%/2   | Total:  7m 05s | Avg:  3m 32s | Max:  3m 48s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 36m 41s | Avg:  5m 14s | Max: 19m 23s | Hits:  98%/2239  
  🟩 12.5               Pass: 100%/2   | Total: 16m 16s | Avg:  8m 08s | Max:  8m 12s
  🟩 12.6               Pass: 100%/39  | Total:  5h 53m | Avg:  9m 04s | Max: 31m 05s | Hits:  99%/7575  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 09m | Avg: 17m 29s | Max: 22m 23s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 36m 41s | Avg:  5m 14s | Max: 19m 23s | Hits:  98%/2239  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 16m 16s | Avg:  8m 08s | Max:  8m 12s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  4h 43m | Avg:  8m 06s | Max: 31m 05s | Hits:  99%/7575  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 09m | Avg: 17m 29s | Max: 22m 23s
  🟩 nvcc               Pass: 100%/44  | Total:  5h 36m | Avg:  7m 39s | Max: 31m 05s | Hits:  99%/9814  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 15m 21s | Avg:  3m 50s | Max:  4m 36s
  🟩 Clang10            Pass: 100%/1   | Total:  4m 48s | Avg:  4m 48s | Max:  4m 48s
  🟩 Clang11            Pass: 100%/1   | Total:  4m 20s | Avg:  4m 20s | Max:  4m 20s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 23s | Avg:  4m 23s | Max:  4m 23s
  🟩 Clang13            Pass: 100%/1   | Total:  4m 10s | Avg:  4m 10s | Max:  4m 10s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 11s | Avg:  4m 11s | Max:  4m 11s
  🟩 Clang15            Pass: 100%/1   | Total:  4m 21s | Avg:  4m 21s | Max:  4m 21s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 23s | Avg:  4m 23s | Max:  4m 23s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 34s | Avg:  4m 34s | Max:  4m 34s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 41m | Avg: 12m 38s | Max: 22m 23s
  🟩 GCC6               Pass: 100%/2   | Total:  5m 18s | Avg:  2m 39s | Max:  2m 47s
  🟩 GCC7               Pass: 100%/2   | Total:  6m 41s | Avg:  3m 20s | Max:  3m 36s
  🟩 GCC8               Pass: 100%/1   | Total:  3m 36s | Avg:  3m 36s | Max:  3m 36s
  🟩 GCC9               Pass: 100%/3   | Total:  9m 05s | Avg:  3m 01s | Max:  3m 33s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 48s | Avg:  3m 48s | Max:  3m 48s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 47s | Avg:  3m 47s | Max:  3m 47s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 00s | Avg:  4m 00s | Max:  4m 00s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 18m | Avg: 13m 53s | Max: 31m 05s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  5m 22s | Avg:  5m 22s | Max:  5m 22s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 19m 23s | Avg: 19m 23s | Max: 19m 23s | Hits:  98%/2239  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 12m 33s | Avg: 12m 33s | Max: 12m 33s | Hits:  99%/2476  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 26m 18s | Avg: 13m 09s | Max: 13m 20s | Hits:  98%/5099  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 16m 16s | Avg:  8m 08s | Max:  8m 12s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  2h 31m | Avg:  7m 35s | Max: 22m 23s
  🟩 GCC                Pass: 100%/21  | Total:  2h 55m | Avg:  8m 20s | Max: 31m 05s
  🟩 Intel              Pass: 100%/1   | Total:  5m 22s | Avg:  5m 22s | Max:  5m 22s
  🟩 MSVC               Pass: 100%/4   | Total: 58m 14s | Avg: 14m 33s | Max: 19m 23s | Hits:  99%/9814  
  🟩 NVHPC              Pass: 100%/2   | Total: 16m 16s | Avg:  8m 08s | Max:  8m 12s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total:  6h 46m | Avg:  8m 28s | Max: 31m 05s | Hits:  99%/9814  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total:  4h 23m | Avg:  6m 25s | Max: 22m 23s | Hits:  99%/9814  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 42m | Avg: 25m 41s | Max: 31m 05s
  🟩 Test               Pass: 100%/2   | Total: 38m 21s | Avg: 19m 10s | Max: 19m 21s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 54s | Avg:  1m 54s | Max:  1m 54s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 13m 14s | Avg: 13m 14s | Max: 13m 14s
  🟩 90a                Pass: 100%/2   | Total: 17m 38s | Avg:  8m 49s | Max: 14m 02s
🟩 std
  🟩 11                 Pass: 100%/6   | Total: 34m 08s | Avg:  5m 41s | Max: 18m 59s
  🟩 14                 Pass: 100%/5   | Total: 59m 36s | Avg: 11m 55s | Max: 29m 14s | Hits:  98%/2239  
  🟩 17                 Pass: 100%/13  | Total:  1h 57m | Avg:  9m 00s | Max: 31m 05s | Hits:  99%/4952  
  🟩 20                 Pass: 100%/23  | Total:  3h 13m | Avg:  8m 25s | Max: 23m 26s | Hits:  98%/2623

🟩 cub: Pass: 100%/47 | Total: 7h 14m | Avg: 9m 15s | Max: 32m 21s | Hits: 99%/3144

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  7h 05m | Avg:  9m 26s | Max: 32m 21s | Hits:  99%/3144  
  🟩 arm64              Pass: 100%/2   | Total:  9m 48s | Avg:  4m 54s | Max:  4m 56s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 41m 30s | Avg:  5m 55s | Max: 14m 31s | Hits:  99%/786   
  🟩 12.5               Pass: 100%/2   | Total: 18m 41s | Avg:  9m 20s | Max:  9m 29s
  🟩 12.6               Pass: 100%/38  | Total:  6h 14m | Avg:  9m 51s | Max: 32m 21s | Hits:  99%/2358  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 03s | Avg:  4m 31s | Max:  4m 33s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 41m 30s | Avg:  5m 55s | Max: 14m 31s | Hits:  99%/786   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 18m 41s | Avg:  9m 20s | Max:  9m 29s
  🟩 nvcc12.6           Pass: 100%/36  | Total:  6h 05m | Avg: 10m 09s | Max: 32m 21s | Hits:  99%/2358  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 03s | Avg:  4m 31s | Max:  4m 33s
  🟩 nvcc               Pass: 100%/45  | Total:  7h 05m | Avg:  9m 27s | Max: 32m 21s | Hits:  99%/3144  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 56s | Avg:  5m 29s | Max:  6m 31s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 38s | Avg:  6m 38s | Max:  6m 38s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 38s | Avg:  5m 38s | Max:  5m 38s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 23s | Avg:  5m 23s | Max:  5m 23s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 43s | Avg:  5m 43s | Max:  5m 43s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 36s | Avg:  5m 36s | Max:  5m 36s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 19m | Avg: 11m 19s | Max: 32m 21s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 38s | Avg:  4m 19s | Max:  4m 29s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 31s | Avg:  5m 15s | Max:  5m 25s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 11s | Avg:  5m 11s | Max:  5m 11s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 52s | Avg:  4m 57s | Max:  5m 49s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 58s | Avg:  5m 58s | Max:  5m 58s
  🟩 GCC12              Pass: 100%/3   | Total: 26m 33s | Avg:  8m 51s | Max: 15m 54s
  🟩 GCC13              Pass: 100%/8   | Total:  2h 10m | Avg: 16m 15s | Max: 32m 01s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 48s | Avg:  6m 48s | Max:  6m 48s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 14m 31s | Avg: 14m 31s | Max: 14m 31s | Hits:  99%/786   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 12m 47s | Avg: 12m 47s | Max: 12m 47s | Hits:  99%/786   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 27m 58s | Avg: 13m 59s | Max: 14m 39s | Hits:  99%/1572  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 18m 41s | Avg:  9m 20s | Max:  9m 29s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 27m | Avg:  7m 44s | Max: 32m 21s
  🟩 GCC                Pass: 100%/21  | Total:  3h 27m | Avg:  9m 51s | Max: 32m 01s
  🟩 Intel              Pass: 100%/1   | Total:  6m 48s | Avg:  6m 48s | Max:  6m 48s
  🟩 MSVC               Pass: 100%/4   | Total: 55m 16s | Avg: 13m 49s | Max: 14m 39s | Hits:  99%/3144  
  🟩 NVHPC              Pass: 100%/2   | Total: 18m 41s | Avg:  9m 20s | Max:  9m 29s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 28s | Avg: 10m 14s | Max: 15m 54s
  🟩 v100               Pass: 100%/45  | Total:  6h 54m | Avg:  9m 12s | Max: 32m 21s | Hits:  99%/3144  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 15m | Avg:  6m 23s | Max: 14m 39s | Hits:  99%/3144  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 29m 50s | Avg: 29m 50s | Max: 29m 50s
  🟩 GraphCapture       Pass: 100%/1   | Total: 17m 31s | Avg: 17m 31s | Max: 17m 31s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 07m | Avg: 22m 30s | Max: 29m 25s
  🟩 TestGPU            Pass: 100%/2   | Total:  1h 04m | Avg: 32m 11s | Max: 32m 21s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 20m 28s | Avg: 10m 14s | Max: 15m 54s
  🟩 90a                Pass: 100%/1   | Total:  4m 24s | Avg:  4m 24s | Max:  4m 24s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 24m 15s | Avg:  4m 51s | Max:  6m 07s
  🟩 14                 Pass: 100%/4   | Total: 30m 56s | Avg:  7m 44s | Max: 14m 31s | Hits:  99%/786   
  🟩 17                 Pass: 100%/12  | Total:  1h 25m | Avg:  7m 06s | Max: 13m 19s | Hits:  99%/1572  
  🟩 20                 Pass: 100%/26  | Total:  4h 54m | Avg: 11m 19s | Max: 32m 21s | Hits:  99%/786

🟩 thrust: Pass: 100%/46 | Total: 6h 14m | Avg: 8m 08s | Max: 25m 39s | Hits: 99%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 17m 41s | Avg:  8m 50s | Max: 11m 48s
🟩 cpu
  🟩 amd64              Pass: 100%/44  | Total:  6h 04m | Avg:  8m 17s | Max: 25m 39s | Hits:  99%/9260  
  🟩 arm64              Pass: 100%/2   | Total:  9m 47s | Avg:  4m 53s | Max:  5m 08s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 44m 38s | Avg:  6m 22s | Max: 18m 44s | Hits:  99%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 29m 06s | Avg: 14m 33s | Max: 15m 09s
  🟩 12.6               Pass: 100%/37  | Total:  5h 00m | Avg:  8m 07s | Max: 25m 39s | Hits:  99%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 57s | Avg:  4m 58s | Max:  5m 05s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 44m 38s | Avg:  6m 22s | Max: 18m 44s | Hits:  99%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 29m 06s | Avg: 14m 33s | Max: 15m 09s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  4h 50m | Avg:  8m 18s | Max: 25m 39s | Hits:  99%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 57s | Avg:  4m 58s | Max:  5m 05s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 04m | Avg:  8m 16s | Max: 25m 39s | Hits:  99%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 20m 42s | Avg:  5m 10s | Max:  6m 26s
  🟩 Clang10            Pass: 100%/1   | Total:  7m 10s | Avg:  7m 10s | Max:  7m 10s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 29s | Avg:  5m 29s | Max:  5m 29s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 08s | Avg:  5m 08s | Max:  5m 08s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 15s | Avg:  5m 15s | Max:  5m 15s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 52s | Avg:  5m 52s | Max:  5m 52s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 23s | Avg:  5m 23s | Max:  5m 23s
  🟩 Clang18            Pass: 100%/7   | Total: 59m 01s | Avg:  8m 25s | Max: 25m 39s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 14s | Avg:  4m 07s | Max:  4m 18s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 15s | Avg:  5m 07s | Max:  5m 20s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 24s | Avg:  5m 24s | Max:  5m 24s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 45s | Avg:  4m 55s | Max:  5m 39s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 33s | Avg:  5m 33s | Max:  5m 33s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 22s | Avg:  5m 22s | Max:  5m 22s
  🟩 GCC12              Pass: 100%/1   | Total:  5m 44s | Avg:  5m 44s | Max:  5m 44s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 04m | Avg:  8m 04s | Max: 16m 21s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  7m 00s | Avg:  7m 00s | Max:  7m 00s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 18m 44s | Avg: 18m 44s | Max: 18m 44s | Hits:  99%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 17m 02s | Avg: 17m 02s | Max: 17m 02s | Hits:  99%/1852  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 57m 46s | Avg: 19m 15s | Max: 22m 10s | Hits:  99%/5556  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 29m 06s | Avg: 14m 33s | Max: 15m 09s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 04m | Avg:  6m 34s | Max: 25m 39s
  🟩 GCC                Pass: 100%/19  | Total:  1h 59m | Avg:  6m 18s | Max: 16m 21s
  🟩 Intel              Pass: 100%/1   | Total:  7m 00s | Avg:  7m 00s | Max:  7m 00s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 33m | Avg: 18m 42s | Max: 22m 10s | Hits:  99%/9260  
  🟩 NVHPC              Pass: 100%/2   | Total: 29m 06s | Avg: 14m 33s | Max: 15m 09s
🟩 gpu
  🟩 v100               Pass: 100%/46  | Total:  6h 14m | Avg:  8m 08s | Max: 25m 39s | Hits:  99%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 42m | Avg:  7m 03s | Max: 18m 44s | Hits:  99%/7408  
  🟩 TestCPU            Pass: 100%/3   | Total: 38m 27s | Avg: 12m 49s | Max: 22m 10s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/3   | Total: 53m 48s | Avg: 17m 56s | Max: 25m 39s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 42s | Avg:  4m 42s | Max:  4m 42s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 22m 50s | Avg:  4m 34s | Max:  5m 42s
  🟩 14                 Pass: 100%/4   | Total: 34m 48s | Avg:  8m 42s | Max: 18m 44s | Hits:  99%/1852  
  🟩 17                 Pass: 100%/12  | Total:  1h 40m | Avg:  8m 21s | Max: 18m 19s | Hits:  99%/3704  
  🟩 20                 Pass: 100%/23  | Total:  3h 18m | Avg:  8m 37s | Max: 25m 39s | Hits:  99%/3704

🟩 cudax: Pass: 100%/26 | Total: 2h 13m | Avg: 5m 08s | Max: 22m 23s | Hits: 92%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 03m | Avg:  5m 35s | Max: 22m 23s | Hits:  92%/312   
  🟩 arm64              Pass: 100%/4   | Total: 10m 32s | Avg:  2m 38s | Max:  2m 45s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 14m 38s | Avg:  4m 52s | Max:  8m 46s | Hits:  92%/156   
  🟩 12.5               Pass: 100%/2   | Total: 11m 01s | Avg:  5m 30s | Max:  5m 31s
  🟩 12.6               Pass: 100%/21  | Total:  1h 48m | Avg:  5m 08s | Max: 22m 23s | Hits:  92%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 14m 38s | Avg:  4m 52s | Max:  8m 46s | Hits:  92%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 11m 01s | Avg:  5m 30s | Max:  5m 31s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 48m | Avg:  5m 08s | Max: 22m 23s | Hits:  92%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 13m | Avg:  5m 08s | Max: 22m 23s | Hits:  92%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  2m 57s | Avg:  2m 57s | Max:  2m 57s
  🟩 Clang10            Pass: 100%/1   | Total:  3m 43s | Avg:  3m 43s | Max:  3m 43s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 17s | Avg:  3m 17s | Max:  3m 17s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 09s | Avg:  3m 09s | Max:  3m 09s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 11s | Avg:  3m 11s | Max:  3m 11s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 09s | Avg:  3m 09s | Max:  3m 09s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 08s | Avg:  3m 08s | Max:  3m 08s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 15s | Avg:  3m 15s | Max:  3m 15s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 24s | Avg:  3m 24s | Max:  3m 24s
  🟩 Clang18            Pass: 100%/4   | Total: 30m 38s | Avg:  7m 39s | Max: 22m 17s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 55s | Avg:  2m 55s | Max:  2m 55s
  🟩 GCC10              Pass: 100%/1   | Total:  2m 57s | Avg:  2m 57s | Max:  2m 57s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 01s | Avg:  3m 01s | Max:  3m 01s
  🟩 GCC12              Pass: 100%/2   | Total: 25m 41s | Avg: 12m 50s | Max: 22m 23s
  🟩 GCC13              Pass: 100%/4   | Total: 10m 45s | Avg:  2m 41s | Max:  2m 46s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 46s | Avg:  8m 46s | Max:  8m 46s | Hits:  92%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 46s | Avg:  8m 46s | Max:  8m 46s | Hits:  92%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 11m 01s | Avg:  5m 30s | Max:  5m 31s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total: 59m 51s | Avg:  4m 36s | Max: 22m 17s
  🟩 GCC                Pass: 100%/9   | Total: 45m 19s | Avg:  5m 02s | Max: 22m 23s
  🟩 MSVC               Pass: 100%/2   | Total: 17m 32s | Avg:  8m 46s | Max:  8m 46s | Hits:  92%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 11m 01s | Avg:  5m 30s | Max:  5m 31s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 13m | Avg:  5m 08s | Max: 22m 23s | Hits:  92%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 29m | Avg:  3m 42s | Max:  8m 46s | Hits:  92%/312   
  🟩 Test               Pass: 100%/2   | Total: 44m 40s | Avg: 22m 20s | Max: 22m 23s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 46s | Avg:  2m 46s | Max:  2m 46s
  🟩 90a                Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 19m 14s | Avg:  3m 12s | Max:  5m 30s
  🟩 20                 Pass: 100%/20  | Total:  1h 54m | Avg:  5m 43s | Max: 22m 23s | Hits:  92%/312

🟩 cccl: Pass: 100%/6 | Total: 25m 04s | Avg: 4m 10s | Max: 4m 38s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 25m 04s | Avg:  4m 10s | Max:  4m 38s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 15s | Avg:  3m 37s | Max:  3m 48s
  🟩 12.0               Pass: 100%/2   | Total:  8m 43s | Avg:  4m 21s | Max:  4m 31s
  🟩 12.6               Pass: 100%/2   | Total:  9m 06s | Avg:  4m 33s | Max:  4m 38s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 15s | Avg:  3m 37s | Max:  3m 48s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  8m 43s | Avg:  4m 21s | Max:  4m 31s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 06s | Avg:  4m 33s | Max:  4m 38s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 25m 04s | Avg:  4m 10s | Max:  4m 38s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 48s | Avg:  3m 48s | Max:  3m 48s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 31s | Avg:  4m 31s | Max:  4m 31s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 38s | Avg:  4m 38s | Max:  4m 38s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 27s | Avg:  3m 27s | Max:  3m 27s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 12s | Avg:  4m 12s | Max:  4m 12s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 28s | Avg:  4m 28s | Max:  4m 28s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 12m 57s | Avg:  4m 19s | Max:  4m 38s
  🟩 GCC                Pass: 100%/3   | Total: 12m 07s | Avg:  4m 02s | Max:  4m 28s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 25m 04s | Avg:  4m 10s | Max:  4m 38s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 25m 04s | Avg:  4m 10s | Max:  4m 38s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 14s | Avg: 5m 07s | Max: 8m 11s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 10m 14s | Avg:  5m 07s | Max:  8m 11s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total: 10m 14s | Avg:  5m 07s | Max:  8m 11s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total: 10m 14s | Avg:  5m 07s | Max:  8m 11s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 10m 14s | Avg:  5m 07s | Max:  8m 11s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 10m 14s | Avg:  5m 07s | Max:  8m 11s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 10m 14s | Avg:  5m 07s | Max:  8m 11s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total: 10m 14s | Avg:  5m 07s | Max:  8m 11s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 03s | Avg:  2m 03s | Max:  2m 03s
  🟩 Test               Pass: 100%/1   | Total:  8m 11s | Avg:  8m 11s | Max:  8m 11s

🟩 python: Pass: 100%/1 | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 176)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

…uild_result' ``` =========================================================================== warnings summary =========================================================================== tests/test_reduce.py::test_reduce_non_contiguous /home/coder/cccl/python/devenv/lib/python3.12/site-packages/_pytest/unraisableexception.py:85: PytestUnraisableExceptionWarning: Exception ignored in: <function _Reduce.__del__ at 0x7bf123139080> Traceback (most recent call last): File "/home/coder/cccl/python/cuda_parallel/cuda/parallel/experimental/algorithms/reduce.py", line 132, in __del__ bindings.cccl_device_reduce_cleanup(ctypes.byref(self.build_result)) ^^^^^^^^^^^^^^^^^ AttributeError: '_Reduce' object has no attribute 'build_result' warnings.warn(pytest.PytestUnraisableExceptionWarning(msg)) -- Docs: https://docs.pytest.org/en/stable/how-to/capture-warnings.html ============================================================= 1 passed, 93 deselected, 1 warning in 0.44s ============================================================== ```

github-actions · 2025-01-06T09:32:43Z

🟩 CI finished in 1h 18m: Pass: 100%/176 | Total: 23h 54m | Avg: 8m 09s | Max: 40m 55s | Hits: 98%/22564

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 06m | Avg: 8m 53s | Max: 29m 00s | Hits: 98%/9860

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total:  6h 59m | Avg:  9m 07s | Max: 29m 00s | Hits:  98%/9860  
  🟩 arm64              Pass: 100%/2   | Total:  6m 58s | Avg:  3m 29s | Max:  3m 36s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 37m 40s | Avg:  5m 22s | Max: 20m 30s | Hits:  98%/2282  
  🟩 12.5               Pass: 100%/2   | Total: 18m 30s | Avg:  9m 15s | Max:  9m 21s
  🟩 12.6               Pass: 100%/39  | Total:  6h 10m | Avg:  9m 30s | Max: 29m 00s | Hits:  98%/7578  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 05m | Avg: 16m 17s | Max: 21m 05s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 37m 40s | Avg:  5m 22s | Max: 20m 30s | Hits:  98%/2282  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 18m 30s | Avg:  9m 15s | Max:  9m 21s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  5h 05m | Avg:  8m 43s | Max: 29m 00s | Hits:  98%/7578  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 05m | Avg: 16m 17s | Max: 21m 05s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 01m | Avg:  8m 13s | Max: 29m 00s | Hits:  98%/9860  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 15m 23s | Avg:  3m 50s | Max:  4m 54s
  🟩 Clang10            Pass: 100%/1   | Total:  5m 09s | Avg:  5m 09s | Max:  5m 09s
  🟩 Clang11            Pass: 100%/1   | Total:  4m 22s | Avg:  4m 22s | Max:  4m 22s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 13s | Avg:  4m 13s | Max:  4m 13s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 58s | Avg:  3m 58s | Max:  3m 58s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 31s | Avg:  4m 31s | Max:  4m 31s
  🟩 Clang15            Pass: 100%/1   | Total:  4m 09s | Avg:  4m 09s | Max:  4m 09s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 16s | Avg:  4m 16s | Max:  4m 16s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 25s | Avg:  4m 25s | Max:  4m 25s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 44m | Avg: 13m 01s | Max: 26m 52s
  🟩 GCC6               Pass: 100%/2   | Total:  5m 11s | Avg:  2m 35s | Max:  2m 39s
  🟩 GCC7               Pass: 100%/2   | Total:  6m 44s | Avg:  3m 22s | Max:  3m 30s
  🟩 GCC8               Pass: 100%/1   | Total:  3m 32s | Avg:  3m 32s | Max:  3m 32s
  🟩 GCC9               Pass: 100%/3   | Total:  9m 15s | Avg:  3m 05s | Max:  3m 38s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 51s | Avg:  3m 51s | Max:  3m 51s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 51s | Avg:  3m 51s | Max:  3m 51s
  🟩 GCC12              Pass: 100%/1   | Total:  3m 43s | Avg:  3m 43s | Max:  3m 43s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 30m | Avg: 15m 05s | Max: 29m 00s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  5m 34s | Avg:  5m 34s | Max:  5m 34s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 20m 30s | Avg: 20m 30s | Max: 20m 30s | Hits:  98%/2282  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 13m 52s | Avg: 13m 52s | Max: 13m 52s | Hits:  98%/2477  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 26m 42s | Avg: 13m 21s | Max: 13m 23s | Hits:  98%/5101  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 18m 30s | Avg:  9m 15s | Max:  9m 21s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  2h 34m | Avg:  7m 43s | Max: 26m 52s
  🟩 GCC                Pass: 100%/21  | Total:  3h 07m | Avg:  8m 54s | Max: 29m 00s
  🟩 Intel              Pass: 100%/1   | Total:  5m 34s | Avg:  5m 34s | Max:  5m 34s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 01m | Avg: 15m 16s | Max: 20m 30s | Hits:  98%/9860  
  🟩 NVHPC              Pass: 100%/2   | Total: 18m 30s | Avg:  9m 15s | Max:  9m 21s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total:  7h 06m | Avg:  8m 53s | Max: 29m 00s | Hits:  98%/9860  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total:  4h 24m | Avg:  6m 26s | Max: 21m 05s | Hits:  98%/9860  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 47m | Avg: 26m 50s | Max: 29m 00s
  🟩 Test               Pass: 100%/2   | Total: 53m 12s | Avg: 26m 36s | Max: 26m 52s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 03s | Avg:  2m 03s | Max:  2m 03s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 12m 08s | Avg: 12m 08s | Max: 12m 08s
  🟩 90a                Pass: 100%/2   | Total: 18m 05s | Avg:  9m 02s | Max: 14m 08s
🟩 std
  🟩 11                 Pass: 100%/6   | Total: 39m 05s | Avg:  6m 30s | Max: 23m 40s
  🟩 14                 Pass: 100%/5   | Total: 59m 41s | Avg: 11m 56s | Max: 28m 08s | Hits:  98%/2282  
  🟩 17                 Pass: 100%/13  | Total:  1h 53m | Avg:  8m 41s | Max: 26m 35s | Hits:  98%/4954  
  🟩 20                 Pass: 100%/23  | Total:  3h 32m | Avg:  9m 15s | Max: 29m 00s | Hits:  98%/2624

🟩 cub: Pass: 100%/47 | Total: 7h 06m | Avg: 9m 04s | Max: 33m 03s | Hits: 99%/3132

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  6h 56m | Avg:  9m 15s | Max: 33m 03s | Hits:  99%/3132  
  🟩 arm64              Pass: 100%/2   | Total:  9m 40s | Avg:  4m 50s | Max:  4m 55s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 42m 14s | Avg:  6m 02s | Max: 15m 32s | Hits:  99%/783   
  🟩 12.5               Pass: 100%/2   | Total: 18m 21s | Avg:  9m 10s | Max:  9m 11s
  🟩 12.6               Pass: 100%/38  | Total:  6h 05m | Avg:  9m 37s | Max: 33m 03s | Hits:  99%/2349  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 54s | Avg:  4m 27s | Max:  4m 33s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 42m 14s | Avg:  6m 02s | Max: 15m 32s | Hits:  99%/783   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 18m 21s | Avg:  9m 10s | Max:  9m 11s
  🟩 nvcc12.6           Pass: 100%/36  | Total:  5h 56m | Avg:  9m 54s | Max: 33m 03s | Hits:  99%/2349  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 54s | Avg:  4m 27s | Max:  4m 33s
  🟩 nvcc               Pass: 100%/45  | Total:  6h 57m | Avg:  9m 16s | Max: 33m 03s | Hits:  99%/3132  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 48s | Avg:  5m 27s | Max:  6m 25s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 33s | Avg:  6m 33s | Max:  6m 33s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 12s | Avg:  5m 12s | Max:  5m 12s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 38s | Avg:  5m 38s | Max:  5m 38s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 16s | Avg:  5m 16s | Max:  5m 16s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 49s | Avg:  5m 49s | Max:  5m 49s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 48s | Avg:  5m 48s | Max:  5m 48s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 38s | Avg:  5m 38s | Max:  5m 38s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 18m | Avg: 11m 13s | Max: 33m 03s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 31s | Avg:  4m 15s | Max:  4m 22s
  🟩 GCC7               Pass: 100%/2   | Total:  9m 59s | Avg:  4m 59s | Max:  5m 00s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 41s | Avg:  5m 41s | Max:  5m 41s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 32s | Avg:  4m 50s | Max:  5m 29s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 21s | Avg:  5m 21s | Max:  5m 21s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 41s | Avg:  5m 41s | Max:  5m 41s
  🟩 GCC12              Pass: 100%/3   | Total: 47m 40s | Avg: 15m 53s | Max: 23m 03s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 44m | Avg: 13m 02s | Max: 25m 11s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 26s | Avg:  6m 26s | Max:  6m 26s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 32s | Avg: 15m 32s | Max: 15m 32s | Hits:  99%/783   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 12m 24s | Avg: 12m 24s | Max: 12m 24s | Hits:  99%/783   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 26m 04s | Avg: 13m 02s | Max: 13m 06s | Hits:  99%/1566  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 18m 21s | Avg:  9m 10s | Max:  9m 11s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 25m | Avg:  7m 40s | Max: 33m 03s
  🟩 GCC                Pass: 100%/21  | Total:  3h 21m | Avg:  9m 36s | Max: 25m 11s
  🟩 Intel              Pass: 100%/1   | Total:  6m 26s | Avg:  6m 26s | Max:  6m 26s
  🟩 MSVC               Pass: 100%/4   | Total: 54m 00s | Avg: 13m 30s | Max: 15m 32s | Hits:  99%/3132  
  🟩 NVHPC              Pass: 100%/2   | Total: 18m 21s | Avg:  9m 10s | Max:  9m 11s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 41m 27s | Avg: 20m 43s | Max: 23m 03s
  🟩 v100               Pass: 100%/45  | Total:  6h 24m | Avg:  8m 33s | Max: 33m 03s | Hits:  99%/3132  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  4h 30m | Avg:  6m 45s | Max: 23m 03s | Hits:  99%/3132  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 22m 56s | Avg: 22m 56s | Max: 22m 56s
  🟩 GraphCapture       Pass: 100%/1   | Total: 18m 24s | Avg: 18m 24s | Max: 18m 24s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 08m | Avg: 22m 50s | Max: 33m 03s
  🟩 TestGPU            Pass: 100%/2   | Total: 46m 29s | Avg: 23m 14s | Max: 25m 11s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 41m 27s | Avg: 20m 43s | Max: 23m 03s
  🟩 90a                Pass: 100%/1   | Total:  4m 20s | Avg:  4m 20s | Max:  4m 20s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 24m 05s | Avg:  4m 49s | Max:  6m 15s
  🟩 14                 Pass: 100%/4   | Total: 31m 18s | Avg:  7m 49s | Max: 15m 32s | Hits:  99%/783   
  🟩 17                 Pass: 100%/12  | Total:  1h 23m | Avg:  6m 59s | Max: 13m 06s | Hits:  99%/1566  
  🟩 20                 Pass: 100%/26  | Total:  4h 47m | Avg: 11m 02s | Max: 33m 03s | Hits:  99%/783

🟩 thrust: Pass: 100%/46 | Total: 6h 18m | Avg: 8m 13s | Max: 31m 36s | Hits: 99%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 16m 50s | Avg:  8m 25s | Max: 10m 56s
🟩 cpu
  🟩 amd64              Pass: 100%/44  | Total:  6h 08m | Avg:  8m 22s | Max: 31m 36s | Hits:  99%/9260  
  🟩 arm64              Pass: 100%/2   | Total:  9m 35s | Avg:  4m 47s | Max:  5m 02s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total:  1h 10m | Avg: 10m 07s | Max: 31m 36s | Hits:  99%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 28m 44s | Avg: 14m 22s | Max: 14m 30s
  🟩 12.6               Pass: 100%/37  | Total:  4h 38m | Avg:  7m 31s | Max: 22m 50s | Hits:  99%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 41s | Avg:  4m 50s | Max:  4m 56s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 10m | Avg: 10m 07s | Max: 31m 36s | Hits:  99%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 28m 44s | Avg: 14m 22s | Max: 14m 30s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  4h 28m | Avg:  7m 41s | Max: 22m 50s | Hits:  99%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 41s | Avg:  4m 50s | Max:  4m 56s
  🟩 nvcc               Pass: 100%/44  | Total:  6h 08m | Avg:  8m 22s | Max: 31m 36s | Hits:  99%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 20m 26s | Avg:  5m 06s | Max:  6m 00s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 43s | Avg:  6m 43s | Max:  6m 43s
  🟩 Clang11            Pass: 100%/1   | Total:  4m 54s | Avg:  4m 54s | Max:  4m 54s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 02s | Avg:  5m 02s | Max:  5m 02s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 12s | Avg:  5m 12s | Max:  5m 12s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 12s | Avg:  5m 12s | Max:  5m 12s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 30s | Avg:  5m 30s | Max:  5m 30s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 11s | Avg:  5m 11s | Max:  5m 11s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 22s | Avg:  5m 22s | Max:  5m 22s
  🟩 Clang18            Pass: 100%/7   | Total: 47m 19s | Avg:  6m 45s | Max: 14m 16s
  🟩 GCC6               Pass: 100%/2   | Total: 35m 22s | Avg: 17m 41s | Max: 31m 36s
  🟩 GCC7               Pass: 100%/2   | Total:  9m 56s | Avg:  4m 58s | Max:  5m 31s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 03s | Avg:  5m 03s | Max:  5m 03s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 19s | Avg:  4m 46s | Max:  5m 39s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 15s | Avg:  5m 15s | Max:  5m 15s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 GCC12              Pass: 100%/1   | Total:  5m 53s | Avg:  5m 53s | Max:  5m 53s
  🟩 GCC13              Pass: 100%/8   | Total: 59m 40s | Avg:  7m 27s | Max: 12m 23s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  7m 01s | Avg:  7m 01s | Max:  7m 01s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 17m 58s | Avg: 17m 58s | Max: 17m 58s | Hits:  99%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 15m 08s | Avg: 15m 08s | Max: 15m 08s | Hits:  99%/1852  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 57m 31s | Avg: 19m 10s | Max: 22m 50s | Hits:  99%/5556  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 28m 44s | Avg: 14m 22s | Max: 14m 30s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  1h 50m | Avg:  5m 50s | Max: 14m 16s
  🟩 GCC                Pass: 100%/19  | Total:  2h 21m | Avg:  7m 25s | Max: 31m 36s
  🟩 Intel              Pass: 100%/1   | Total:  7m 01s | Avg:  7m 01s | Max:  7m 01s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 30m | Avg: 18m 07s | Max: 22m 50s | Hits:  99%/9260  
  🟩 NVHPC              Pass: 100%/2   | Total: 28m 44s | Avg: 14m 22s | Max: 14m 30s
🟩 gpu
  🟩 v100               Pass: 100%/46  | Total:  6h 18m | Avg:  8m 13s | Max: 31m 36s | Hits:  99%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  5h 02m | Avg:  7m 33s | Max: 31m 36s | Hits:  99%/7408  
  🟩 TestCPU            Pass: 100%/3   | Total: 38m 22s | Avg: 12m 47s | Max: 22m 50s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/3   | Total: 37m 35s | Avg: 12m 31s | Max: 14m 16s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 45s | Avg:  4m 45s | Max:  4m 45s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 22m 02s | Avg:  4m 24s | Max:  5m 33s
  🟩 14                 Pass: 100%/4   | Total:  1h 01m | Avg: 15m 16s | Max: 31m 36s | Hits:  99%/1852  
  🟩 17                 Pass: 100%/12  | Total:  1h 35m | Avg:  7m 59s | Max: 16m 38s | Hits:  99%/3704  
  🟩 20                 Pass: 100%/23  | Total:  3h 02m | Avg:  7m 56s | Max: 22m 50s | Hits:  99%/3704

🟩 cudax: Pass: 100%/26 | Total: 2h 05m | Avg: 4m 48s | Max: 17m 30s | Hits: 92%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  1h 53m | Avg:  5m 08s | Max: 17m 30s | Hits:  92%/312   
  🟩 arm64              Pass: 100%/4   | Total: 12m 03s | Avg:  3m 00s | Max:  3m 22s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 14m 07s | Avg:  4m 42s | Max:  8m 23s | Hits:  92%/156   
  🟩 12.5               Pass: 100%/2   | Total: 10m 56s | Avg:  5m 28s | Max:  5m 38s
  🟩 12.6               Pass: 100%/21  | Total:  1h 40m | Avg:  4m 45s | Max: 17m 30s | Hits:  92%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 14m 07s | Avg:  4m 42s | Max:  8m 23s | Hits:  92%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 10m 56s | Avg:  5m 28s | Max:  5m 38s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 40m | Avg:  4m 45s | Max: 17m 30s | Hits:  92%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 05m | Avg:  4m 48s | Max: 17m 30s | Hits:  92%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  2m 57s | Avg:  2m 57s | Max:  2m 57s
  🟩 Clang10            Pass: 100%/1   | Total:  4m 09s | Avg:  4m 09s | Max:  4m 09s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 03s | Avg:  3m 03s | Max:  3m 03s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 05s | Avg:  3m 05s | Max:  3m 05s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 15s | Avg:  3m 15s | Max:  3m 15s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 18s | Avg:  3m 18s | Max:  3m 18s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 16s | Avg:  3m 16s | Max:  3m 16s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 19s | Avg:  3m 19s | Max:  3m 19s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 15s | Avg:  3m 15s | Max:  3m 15s
  🟩 Clang18            Pass: 100%/4   | Total: 27m 14s | Avg:  6m 48s | Max: 17m 30s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 47s | Avg:  2m 47s | Max:  2m 47s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 23s | Avg:  3m 23s | Max:  3m 23s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 01s | Avg:  3m 01s | Max:  3m 01s
  🟩 GCC12              Pass: 100%/2   | Total: 19m 25s | Avg:  9m 42s | Max: 16m 24s
  🟩 GCC13              Pass: 100%/4   | Total: 11m 44s | Avg:  2m 56s | Max:  3m 28s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 23s | Avg:  8m 23s | Max:  8m 23s | Hits:  92%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 34s | Avg:  8m 34s | Max:  8m 34s | Hits:  92%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 10m 56s | Avg:  5m 28s | Max:  5m 38s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total: 56m 51s | Avg:  4m 22s | Max: 17m 30s
  🟩 GCC                Pass: 100%/9   | Total: 40m 20s | Avg:  4m 28s | Max: 16m 24s
  🟩 MSVC               Pass: 100%/2   | Total: 16m 57s | Avg:  8m 28s | Max:  8m 34s | Hits:  92%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 10m 56s | Avg:  5m 28s | Max:  5m 38s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 05m | Avg:  4m 48s | Max: 17m 30s | Hits:  92%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 31m | Avg:  3m 47s | Max:  8m 34s | Hits:  92%/312   
  🟩 Test               Pass: 100%/2   | Total: 33m 54s | Avg: 16m 57s | Max: 17m 30s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  3m 28s | Avg:  3m 28s | Max:  3m 28s
  🟩 90a                Pass: 100%/1   | Total:  2m 54s | Avg:  2m 54s | Max:  2m 54s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 20m 32s | Avg:  3m 25s | Max:  5m 18s
  🟩 20                 Pass: 100%/20  | Total:  1h 44m | Avg:  5m 13s | Max: 17m 30s | Hits:  92%/312

🟩 cccl: Pass: 100%/6 | Total: 27m 20s | Avg: 4m 33s | Max: 5m 13s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 27m 20s | Avg:  4m 33s | Max:  5m 13s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 32s | Avg:  3m 46s | Max:  4m 05s
  🟩 12.0               Pass: 100%/2   | Total:  9m 45s | Avg:  4m 52s | Max:  4m 54s
  🟩 12.6               Pass: 100%/2   | Total: 10m 03s | Avg:  5m 01s | Max:  5m 13s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 32s | Avg:  3m 46s | Max:  4m 05s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  9m 45s | Avg:  4m 52s | Max:  4m 54s
  🟩 nvcc12.6           Pass: 100%/2   | Total: 10m 03s | Avg:  5m 01s | Max:  5m 13s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 27m 20s | Avg:  4m 33s | Max:  5m 13s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 05s | Avg:  4m 05s | Max:  4m 05s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 51s | Avg:  4m 51s | Max:  4m 51s
  🟩 Clang18            Pass: 100%/1   | Total:  5m 13s | Avg:  5m 13s | Max:  5m 13s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 27s | Avg:  3m 27s | Max:  3m 27s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 54s | Avg:  4m 54s | Max:  4m 54s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 50s | Avg:  4m 50s | Max:  4m 50s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 14m 09s | Avg:  4m 43s | Max:  5m 13s
  🟩 GCC                Pass: 100%/3   | Total: 13m 11s | Avg:  4m 23s | Max:  4m 54s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 27m 20s | Avg:  4m 33s | Max:  5m 13s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 27m 20s | Avg:  4m 33s | Max:  5m 13s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 44s | Avg: 4m 52s | Max: 7m 24s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  7m 24s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  7m 24s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  7m 24s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  7m 24s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  7m 24s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  7m 24s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total:  9m 44s | Avg:  4m 52s | Max:  7m 24s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 20s | Avg:  2m 20s | Max:  2m 20s
  🟩 Test               Pass: 100%/1   | Total:  7m 24s | Avg:  7m 24s | Max:  7m 24s

🟩 python: Pass: 100%/1 | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 176)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

vyasr · 2025-01-07T18:20:57Z

python/cuda_cccl/setup.py

+CCCL_PATH = PROJECT_PATH.parents[1]
+
+
+def copy_cccl_headers_to_cuda_cccl_include():


I don't think this is the best way to solve this problem. It probably works in many cases, but it also has a lot of sharp edges. The better solution for this kind of installation (the problem described in

cccl/ci/test_python.sh

Line 23 in d6253b5

# Temporarily install the package twice to populate include directory as part of the first installation

) is to override setuptools's commands. Here is an example: https://stackoverflow.com/questions/2145779/setup-py-installing-just-a-pth-file/71137790#71137790

Done: 71fd243

vyasr · 2025-01-07T18:23:44Z

python/cuda_cooperative/setup.py

    install_requires=[
+        f"cuda-cccl @ file://{CCCL_PYTHON_PATH}/cuda_cccl",


This isn't what you want. This is going to hardcode the path into the installation requirements in a way that means that you'll pretty much never be able to ship a wheel because the wheel will try and install cuda-cccl from a specific path. I would remove this and update whatever build scripts you run in CI to do this with something like a pip constraint file.

If you do that, I would also get rid of setup.py altogether because everything in this file becomes static and could be moved to pyproject.toml.

This isn't what you want.

Well, is that really true? ... @leofang I've been wondering all the while about the granularity of

cuda_cccl

cuda_parallel

cuda_cooperative

all originating from the same git repo.

Cons: Causes significant extra work, and possibly worse long term, version mismatch issues. With cuda_parallel, we're shipping site-packages/cuda/parallel/experimental/cccl/libcccl.c.parallel.so. What if the CCCL header files (in cuda-cccl) do not match exactly because they are installed separately? Do we have to worry about ODR issues?

What are the Pros of distributing 3 pip packages originating from the same git repo?

I would remove this and update whatever build scripts you run in CI to do this with something like a pip constraint file.

That's almost great: commit 79057cf

But it only works with absolute pathnames. :-(

-cuda-cccl @ file:///home/coder/cccl/python/cuda_cccl +cuda-cccl @ file://../cuda_cccl

ValueError: non-local file URIs are not supported on this platform: 'file://../cuda_cccl'

(When using a cccl Dev container.)

I would also get rid of setup.py

I still have this in setup.py:

setup( license_files=["../../LICENSE"], )

That's the only case I found, apparently escaping the setuptools checks for sources pulled from a parent directory. ChatGPT claims those checks are intentional.

Well, is that really true?

IIUC there are two separate questions that you're really asking:

Do we need to ensure that the versions of these three packages are "exactly" compatible when installed (with "exactly" potentially going beyond API compatibility to meaning all the shared files are in the same locations, ABI compatibility, etc)?

Should the constraint in the package be specified this way.

(1) is a very good question. I don't know how tightly coupled these packages are, and you may indeed need to enforce some tight coupling. In RAPIDS I set up a versioning scheme for our nightlies where every single build of a package gets a unique alpha version so that we have such tight coupling. Maybe you need something similar.

(2) is not the way to handle (1), though. If you specify this kind of constraint in setup.py (or pyproject.toml) and then build a wheel, I assume the path will get built into the wheel. I wouldn't expect such a wheel to even be valid to upload (hopefully indexes would reject it), but if we assume for the moment that you could upload such a wheel, it would never be installable on the user's system because it has a hardcoded path embedded in a requirement that will presumably be unsatisfiable unless they manually download the dependency to that location. The only good way for a user to get around this will be to manually pip install cuda-cccl themselves (which I believe will satisfy this constraint, but can't guarantee).

What if the CCCL header files (in cuda-cccl) do not match exactly because they are installed separately? Do we have to worry about ODR issues?

This should not happen because our Python version scheme

PY_MAJOR.PY_MINOR.CCCL_MAJOR.CCCL_MINOR.CCCL_PATCH

could be used at runtime to enforce (or relax) a version lock (use importlib.metadata to get the package version).

Alternatively, cuda.coop/par could declare a dependency on cuda-cccl in pyproject.toml, then the version constraint is enforced at the pip level (which is preferred). You'd say "but cuda-cccl is not pip installable yet!" and we could work around both locally and in the CI by either

doing pip install --no-deps cuda-parallel to only install cuda-parallel without also installing cuda-cccl, or

manually installing from the bottom of the dependency graph (pip install cuda-cccl first, and then cuda.coop/par, splitting into 2 pip install steps)

this is also how we test cuda.core in NVIDIA/cuda-python CI (which tests against in-development cuda.bindings, exactly the same situation)

In any case I don't think version mismatch is something we need to worry about, before we're ready to push out packages.

What are the Pros of distributing 3 pip packages originating from the same git repo?

They are co-developed

They share the same set of headers

They use the same CI infra (which is close to nothing currently, on the Python side, if I am being honest)

I'd be more than happy to chat about this, but I don't see why we need this discussion to address Vyas's original question in this thread? I would ask @vyasr

I would remove this and update whatever build scripts you run in CI to do this with something like a pip constraint file.

What are we trying to achieve here?

What are we trying to achieve here?

My assumption is that we want two things:

When you build and distribute a cuda_cccl package, you want to specify that it should only be installed with compatible versions of cuda_parallel. That probably means that the release versions should match. That should be achieved with just a version constraint and should not require pinning to an exact file.

When you are running CI tests of a specific commit on the repo (for example), you want to verify that you are testing builds of cuda_cccl and cuda_parallel from that exact commit. To do that, you build both in the same PR, then install in such a way as to ensure that you only get those two. To do that, you either explicitly install exactly those files with --no-deps and then their dependencies manually, or you do a normal pip install command but use something like a constraint file to indicate that this particular cuda_parallel build only works with the cuda_cccl wheel that was just built and lives in whatever directory.

vyasr · 2025-01-07T18:25:18Z

python/cuda_parallel/setup.py

Some of the same comments from the previous two setup.py files apply here as well. More generally I would recommend rewriting this package to use scikit-build-core because you are using CMake. That may be out of scope for this PR though. If you wanted to stage the work into two separate PRs that would be reasonable. The main problem will be that the setuptools build won't be the most easily managed until then and will be hard to debug.

xref: #3201 (comment)

I would add some notes to the discussion Leo linked.

Technically, a custom copy routine is a bit nerve wrecking, especially after we encountered the incident (CUDAINST-3178) that for many months the nvidia-cuda-cccl-cuXX wheels were completely not usable.

This kind of problem is inevitable when using custom copy routines with setuptools as I mentioned above because it is fundamentally not what setup.py is designed for in the modern ecosystem. A lot of the problems come from bridging historical gaps. Whereas 15 years ago you could rely on setup.py being a Python script that was simply executed to install, now you have to think about the fact that all modern tooling involves going through a (possibly transient) wheel and you must inject commands at the right stage. If you use setuptools, that invariably means that you need to override their commands to get things right in all cases (wheels, sdists, from source, etc).

Culturally, our RAPIDS friends try to stay away from setuptools, and using scikit-build-core could help us ask for helps from RAPIDS easier because they're familiar with it

I would qualify this by saying that we stay away from setuptools for packages that are going to use CMake already. If you have a pure Python package (or Python + Cython) setuptools is perfectly fine. The problem comes from when you need to also invoke CMake. Every build system I've ever worked with that tried to do custom stitching together of setuptools and CMake had problems that were hard to solve and often even harder to track down. It's simply not worthwhile to open yourself up to bugs that you may not even know are there. FWIW, from what I've seen recently pyarrow has one of the better setups here.

Let's do minimal work to unblock ourselves so that we can focus on more important things.

I would agree with this too, with the caveat that you probably have more bugs that you're not aware of 🙂 if you can get things working "well enough" with setuptools then no need to switch right now. I just worry that you'll quickly accumulate various patches to keep that working and in six months you'll have an overly complex setup script to deal with as a result.

…ss CustomBuildPy`

rwgk · 2025-01-09T04:58:52Z

/ok to test

github-actions · 2025-01-09T06:11:37Z

🟨 CI finished in 1h 10m: Pass: 98%/170 | Total: 1d 03h | Avg: 9m 48s | Max: 58m 53s | Hits: 527%/15310

🟨 cub: Pass: 93%/45 | Total: 8h 24m | Avg: 11m 12s | Max: 58m 53s

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  93%/43  | Total:  8h 15m | Avg: 11m 30s | Max: 58m 53s
  🟩 arm64              Pass: 100%/2   | Total:  9m 35s | Avg:  4m 47s | Max:  4m 50s
🔍 ctk: 12.6 🔍
  🟩 11.1               Pass: 100%/6   | Total: 25m 58s | Avg:  4m 19s | Max:  4m 53s
  🟩 12.5               Pass: 100%/2   | Total: 18m 42s | Avg:  9m 21s | Max:  9m 39s
  🔍 12.6               Pass:  91%/37  | Total:  7h 39m | Avg: 12m 25s | Max: 58m 53s
🔍 cudacxx: nvcc12.6 🔍
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 56s | Avg:  4m 28s | Max:  4m 36s
  🟩 nvcc11.1           Pass: 100%/6   | Total: 25m 58s | Avg:  4m 19s | Max:  4m 53s
  🟩 nvcc12.5           Pass: 100%/2   | Total: 18m 42s | Avg:  9m 21s | Max:  9m 39s
  🔍 nvcc12.6           Pass:  91%/35  | Total:  7h 31m | Avg: 12m 53s | Max: 58m 53s
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 56s | Avg:  4m 28s | Max:  4m 36s
  🔍 nvcc               Pass:  93%/43  | Total:  8h 15m | Avg: 11m 31s | Max: 58m 53s
🚨 cxx_family: MSVC 🚨
  🟩 Clang              Pass: 100%/19  | Total:  2h 32m | Avg:  8m 00s | Max: 34m 11s
  🟩 GCC                Pass: 100%/21  | Total:  4h 06m | Avg: 11m 45s | Max: 58m 53s
  🔥 MSVC               Pass:   0%/3   | Total:  1h 27m | Avg: 29m 01s | Max: 30m 41s
  🟩 NVHPC              Pass: 100%/2   | Total: 18m 42s | Avg:  9m 21s | Max:  9m 39s
🔍 gpu: v100 🔍
  🟩 h100               Pass: 100%/2   | Total: 20m 13s | Avg: 10m 06s | Max: 16m 05s
  🔍 v100               Pass:  93%/43  | Total:  8h 04m | Avg: 11m 15s | Max: 58m 53s
🔍 jobs: Build 🔍
  🔍 Build              Pass:  92%/38  | Total:  5h 31m | Avg:  8m 43s | Max: 58m 53s
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 22m 41s | Avg: 22m 41s | Max: 22m 41s
  🟩 GraphCapture       Pass: 100%/1   | Total: 20m 12s | Avg: 20m 12s | Max: 20m 12s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 12m | Avg: 24m 13s | Max: 34m 11s
  🟩 TestGPU            Pass: 100%/2   | Total: 57m 48s | Avg: 28m 54s | Max: 31m 38s
🟨 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 27s | Avg:  5m 21s | Max:  6m 26s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 38s | Avg:  6m 38s | Max:  6m 38s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 14s | Avg:  5m 14s | Max:  5m 14s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 30s | Avg:  5m 30s | Max:  5m 30s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 42s | Avg:  5m 42s | Max:  5m 42s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 21s | Avg:  5m 21s | Max:  5m 21s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 47s | Avg:  5m 47s | Max:  5m 47s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 42s | Avg:  5m 42s | Max:  5m 42s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 25m | Avg: 12m 10s | Max: 34m 11s
  🟩 GCC7               Pass: 100%/4   | Total: 18m 56s | Avg:  4m 44s | Max:  5m 28s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 25s | Avg:  4m 48s | Max:  5m 51s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 54s | Avg:  5m 54s | Max:  5m 54s
  🟩 GCC12              Pass: 100%/3   | Total:  1h 19m | Avg: 26m 22s | Max: 58m 53s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 57m | Avg: 14m 42s | Max: 31m 38s
  🟥 MSVC14.29          Pass:   0%/1   | Total: 28m 18s | Avg: 28m 18s | Max: 28m 18s
  🟥 MSVC14.39          Pass:   0%/2   | Total: 58m 45s | Avg: 29m 22s | Max: 30m 41s
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 18m 42s | Avg:  9m 21s | Max:  9m 39s
🟨 std
  🟩 11                 Pass: 100%/5   | Total: 23m 37s | Avg:  4m 43s | Max:  5m 57s
  🟩 14                 Pass: 100%/2   | Total: 11m 54s | Avg:  5m 57s | Max:  6m 26s
  🟨 17                 Pass:  83%/12  | Total:  1h 53m | Avg:  9m 25s | Max: 28m 18s
  🟨 20                 Pass:  96%/26  | Total:  5h 55m | Avg: 13m 41s | Max: 58m 53s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 20m 13s | Avg: 10m 06s | Max: 16m 05s
  🟩 90a                Pass: 100%/1   | Total:  4m 20s | Avg:  4m 20s | Max:  4m 20s

🟩 libcudacxx: Pass: 100%/46 | Total: 8h 38m | Avg: 11m 15s | Max: 30m 58s | Hits: 682%/7590

🟩 cpu
  🟩 amd64              Pass: 100%/44  | Total:  7h 56m | Avg: 10m 50s | Max: 30m 58s | Hits: 682%/7590  
  🟩 arm64              Pass: 100%/2   | Total: 41m 03s | Avg: 20m 31s | Max: 20m 35s
🟩 ctk
  🟩 11.1               Pass: 100%/6   | Total: 17m 49s | Avg:  2m 58s | Max:  3m 38s
  🟩 12.5               Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 51s
  🟩 12.6               Pass: 100%/38  | Total:  8h 02m | Avg: 12m 42s | Max: 30m 58s | Hits: 682%/7590  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 07m | Avg: 16m 55s | Max: 22m 13s
  🟩 nvcc11.1           Pass: 100%/6   | Total: 17m 49s | Avg:  2m 58s | Max:  3m 38s
  🟩 nvcc12.5           Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 51s
  🟩 nvcc12.6           Pass: 100%/34  | Total:  6h 55m | Avg: 12m 12s | Max: 30m 58s | Hits: 682%/7590  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 07m | Avg: 16m 55s | Max: 22m 13s
  🟩 nvcc               Pass: 100%/42  | Total:  7h 30m | Avg: 10m 43s | Max: 30m 58s | Hits: 682%/7590  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 15m 51s | Avg:  3m 57s | Max:  5m 07s
  🟩 Clang10            Pass: 100%/1   | Total:  5m 06s | Avg:  5m 06s | Max:  5m 06s
  🟩 Clang11            Pass: 100%/1   | Total: 22m 02s | Avg: 22m 02s | Max: 22m 02s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 09s | Avg:  4m 09s | Max:  4m 09s
  🟩 Clang13            Pass: 100%/1   | Total:  4m 16s | Avg:  4m 16s | Max:  4m 16s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 19s | Avg:  4m 19s | Max:  4m 19s
  🟩 Clang15            Pass: 100%/1   | Total:  4m 29s | Avg:  4m 29s | Max:  4m 29s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 09s | Avg:  4m 09s | Max:  4m 09s
  🟩 Clang17            Pass: 100%/1   | Total: 22m 01s | Avg: 22m 01s | Max: 22m 01s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 54m | Avg: 14m 16s | Max: 22m 13s
  🟩 GCC7               Pass: 100%/4   | Total: 12m 01s | Avg:  3m 00s | Max:  3m 33s
  🟩 GCC8               Pass: 100%/1   | Total:  3m 38s | Avg:  3m 38s | Max:  3m 38s
  🟩 GCC9               Pass: 100%/3   | Total: 22m 50s | Avg:  7m 36s | Max: 17m 20s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 36s | Avg:  3m 36s | Max:  3m 36s
  🟩 GCC11              Pass: 100%/1   | Total: 16m 51s | Avg: 16m 51s | Max: 16m 51s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 05s | Avg:  4m 05s | Max:  4m 05s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 35m | Avg: 15m 35s | Max: 30m 58s
  🟩 MSVC14.29          Pass: 100%/1   | Total: 24m 10s | Avg: 24m 10s | Max: 24m 10s | Hits: 683%/2481  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 56m 57s | Avg: 28m 28s | Max: 29m 38s | Hits: 682%/5109  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 51s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  3h 20m | Avg: 10m 01s | Max: 22m 13s
  🟩 GCC                Pass: 100%/21  | Total:  3h 38m | Avg: 10m 25s | Max: 30m 58s
  🟩 MSVC               Pass: 100%/3   | Total:  1h 21m | Avg: 27m 02s | Max: 29m 38s | Hits: 682%/7590  
  🟩 NVHPC              Pass: 100%/2   | Total: 17m 29s | Avg:  8m 44s | Max:  8m 51s
🟩 gpu
  🟩 v100               Pass: 100%/46  | Total:  8h 38m | Avg: 11m 15s | Max: 30m 58s | Hits: 682%/7590  
🟩 jobs
  🟩 Build              Pass: 100%/39  | Total:  6h 16m | Avg:  9m 39s | Max: 29m 38s | Hits: 682%/7590  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 44m | Avg: 26m 11s | Max: 30m 58s
  🟩 Test               Pass: 100%/2   | Total: 34m 26s | Avg: 17m 13s | Max: 17m 19s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 58s | Avg:  1m 58s | Max:  1m 58s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 13m 42s | Avg: 13m 42s | Max: 13m 42s
  🟩 90a                Pass: 100%/2   | Total: 17m 22s | Avg:  8m 41s | Max: 13m 42s
🟩 std
  🟩 11                 Pass: 100%/6   | Total: 35m 54s | Avg:  5m 59s | Max: 20m 53s
  🟩 14                 Pass: 100%/3   | Total: 38m 45s | Avg: 12m 55s | Max: 30m 05s
  🟩 17                 Pass: 100%/13  | Total:  2h 32m | Avg: 11m 46s | Max: 30m 58s | Hits: 683%/4962  
  🟩 20                 Pass: 100%/23  | Total:  4h 48m | Avg: 12m 32s | Max: 29m 38s | Hits: 682%/2628

🟩 thrust: Pass: 100%/44 | Total: 7h 13m | Avg: 9m 51s | Max: 37m 53s | Hits: 365%/7408

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 19m 48s | Avg:  9m 54s | Max: 13m 52s
🟩 cpu
  🟩 amd64              Pass: 100%/42  | Total:  7h 04m | Avg: 10m 06s | Max: 37m 53s | Hits: 365%/7408  
  🟩 arm64              Pass: 100%/2   | Total:  9m 26s | Avg:  4m 43s | Max:  4m 55s
🟩 ctk
  🟩 11.1               Pass: 100%/6   | Total: 25m 29s | Avg:  4m 14s | Max:  4m 48s
  🟩 12.5               Pass: 100%/2   | Total: 28m 45s | Avg: 14m 22s | Max: 14m 48s
  🟩 12.6               Pass: 100%/36  | Total:  6h 19m | Avg: 10m 32s | Max: 37m 53s | Hits: 365%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 56s | Avg:  4m 58s | Max:  5m 00s
  🟩 nvcc11.1           Pass: 100%/6   | Total: 25m 29s | Avg:  4m 14s | Max:  4m 48s
  🟩 nvcc12.5           Pass: 100%/2   | Total: 28m 45s | Avg: 14m 22s | Max: 14m 48s
  🟩 nvcc12.6           Pass: 100%/34  | Total:  6h 09m | Avg: 10m 52s | Max: 37m 53s | Hits: 365%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 56s | Avg:  4m 58s | Max:  5m 00s
  🟩 nvcc               Pass: 100%/42  | Total:  7h 04m | Avg: 10m 05s | Max: 37m 53s | Hits: 365%/7408  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 18s | Avg:  5m 19s | Max:  6m 40s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 59s | Avg:  6m 59s | Max:  6m 59s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 11s | Avg:  5m 11s | Max:  5m 11s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 48s | Avg:  5m 48s | Max:  5m 48s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 17s | Avg:  5m 17s | Max:  5m 17s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 46s | Avg:  5m 46s | Max:  5m 46s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 46s | Avg:  5m 46s | Max:  5m 46s
  🟩 Clang18            Pass: 100%/7   | Total: 52m 47s | Avg:  7m 32s | Max: 20m 10s
  🟩 GCC7               Pass: 100%/4   | Total: 50m 37s | Avg: 12m 39s | Max: 37m 53s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 17s | Avg:  5m 17s | Max:  5m 17s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 21s | Avg:  4m 47s | Max:  5m 44s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 GCC12              Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 16m | Avg:  9m 34s | Max: 28m 07s
  🟩 MSVC14.29          Pass: 100%/1   | Total: 27m 14s | Avg: 27m 14s | Max: 27m 14s | Hits: 365%/1852  
  🟩 MSVC14.39          Pass: 100%/3   | Total:  1h 34m | Avg: 31m 28s | Max: 35m 42s | Hits: 365%/5556  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 28m 45s | Avg: 14m 22s | Max: 14m 48s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  1h 59m | Avg:  6m 18s | Max: 20m 10s
  🟩 GCC                Pass: 100%/19  | Total:  2h 43m | Avg:  8m 36s | Max: 37m 53s
  🟩 MSVC               Pass: 100%/4   | Total:  2h 01m | Avg: 30m 24s | Max: 35m 42s | Hits: 365%/7408  
  🟩 NVHPC              Pass: 100%/2   | Total: 28m 45s | Avg: 14m 22s | Max: 14m 48s
🟩 gpu
  🟩 v100               Pass: 100%/44  | Total:  7h 13m | Avg:  9m 51s | Max: 37m 53s | Hits: 365%/7408  
🟩 jobs
  🟩 Build              Pass: 100%/38  | Total:  5h 21m | Avg:  8m 27s | Max: 37m 53s | Hits: 365%/5556  
  🟩 TestCPU            Pass: 100%/3   | Total: 50m 12s | Avg: 16m 44s | Max: 35m 42s | Hits: 365%/1852  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 02m | Avg: 20m 43s | Max: 28m 07s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 32s | Avg:  4m 32s | Max:  4m 32s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 22m 16s | Avg:  4m 27s | Max:  5m 46s
  🟩 14                 Pass: 100%/2   | Total: 44m 33s | Avg: 22m 16s | Max: 37m 53s
  🟩 17                 Pass: 100%/12  | Total:  1h 56m | Avg:  9m 42s | Max: 27m 40s | Hits: 365%/3704  
  🟩 20                 Pass: 100%/23  | Total:  3h 50m | Avg: 10m 02s | Max: 35m 42s | Hits: 365%/3704

🟩 cudax: Pass: 100%/26 | Total: 2h 14m | Avg: 5m 10s | Max: 19m 17s | Hits: 582%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 02m | Avg:  5m 33s | Max: 19m 17s | Hits: 582%/312   
  🟩 arm64              Pass: 100%/4   | Total: 11m 55s | Avg:  2m 58s | Max:  3m 52s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 17m 39s | Avg:  5m 53s | Max: 11m 42s | Hits: 582%/156   
  🟩 12.5               Pass: 100%/2   | Total: 10m 35s | Avg:  5m 17s | Max:  5m 19s
  🟩 12.6               Pass: 100%/21  | Total:  1h 46m | Avg:  5m 03s | Max: 19m 17s | Hits: 582%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 17m 39s | Avg:  5m 53s | Max: 11m 42s | Hits: 582%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 10m 35s | Avg:  5m 17s | Max:  5m 19s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 46m | Avg:  5m 03s | Max: 19m 17s | Hits: 582%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 14m | Avg:  5m 10s | Max: 19m 17s | Hits: 582%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 09s | Avg:  3m 09s | Max:  3m 09s
  🟩 Clang10            Pass: 100%/1   | Total:  3m 36s | Avg:  3m 36s | Max:  3m 36s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 19s | Avg:  3m 19s | Max:  3m 19s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 12s | Avg:  3m 12s | Max:  3m 12s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 01s | Avg:  3m 01s | Max:  3m 01s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 18s | Avg:  3m 18s | Max:  3m 18s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 19s | Avg:  3m 19s | Max:  3m 19s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 26s | Avg:  3m 26s | Max:  3m 26s
  🟩 Clang18            Pass: 100%/4   | Total: 29m 08s | Avg:  7m 17s | Max: 19m 17s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 48s | Avg:  2m 48s | Max:  2m 48s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 03s | Avg:  3m 03s | Max:  3m 03s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 18s | Avg:  3m 18s | Max:  3m 18s
  🟩 GCC12              Pass: 100%/2   | Total: 22m 11s | Avg: 11m 05s | Max: 19m 03s
  🟩 GCC13              Pass: 100%/4   | Total: 10m 52s | Avg:  2m 43s | Max:  2m 51s
  🟩 MSVC14.36          Pass: 100%/1   | Total: 11m 42s | Avg: 11m 42s | Max: 11m 42s | Hits: 582%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total: 11m 10s | Avg: 11m 10s | Max: 11m 10s | Hits: 582%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 10m 35s | Avg:  5m 17s | Max:  5m 19s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total: 58m 41s | Avg:  4m 30s | Max: 19m 17s
  🟩 GCC                Pass: 100%/9   | Total: 42m 12s | Avg:  4m 41s | Max: 19m 03s
  🟩 MSVC               Pass: 100%/2   | Total: 22m 52s | Avg: 11m 26s | Max: 11m 42s | Hits: 582%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 10m 35s | Avg:  5m 17s | Max:  5m 19s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 14m | Avg:  5m 10s | Max: 19m 17s | Hits: 582%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 36m | Avg:  4m 00s | Max: 11m 42s | Hits: 582%/312   
  🟩 Test               Pass: 100%/2   | Total: 38m 20s | Avg: 19m 10s | Max: 19m 17s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 39s | Avg:  2m 39s | Max:  2m 39s
  🟩 90a                Pass: 100%/1   | Total:  2m 51s | Avg:  2m 51s | Max:  2m 51s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 20m 21s | Avg:  3m 23s | Max:  5m 16s
  🟩 20                 Pass: 100%/20  | Total:  1h 53m | Avg:  5m 41s | Max: 19m 17s | Hits: 582%/312

🟩 cccl: Pass: 100%/6 | Total: 24m 18s | Avg: 4m 03s | Max: 4m 42s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 24m 18s | Avg:  4m 03s | Max:  4m 42s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  6m 52s | Avg:  3m 26s | Max:  3m 50s
  🟩 12.0               Pass: 100%/2   | Total:  8m 50s | Avg:  4m 25s | Max:  4m 27s
  🟩 12.6               Pass: 100%/2   | Total:  8m 36s | Avg:  4m 18s | Max:  4m 42s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  6m 52s | Avg:  3m 26s | Max:  3m 50s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  8m 50s | Avg:  4m 25s | Max:  4m 27s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  8m 36s | Avg:  4m 18s | Max:  4m 42s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 24m 18s | Avg:  4m 03s | Max:  4m 42s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 50s | Avg:  3m 50s | Max:  3m 50s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 23s | Avg:  4m 23s | Max:  4m 23s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 42s | Avg:  4m 42s | Max:  4m 42s
  🟩 GCC7               Pass: 100%/1   | Total:  3m 02s | Avg:  3m 02s | Max:  3m 02s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 27s | Avg:  4m 27s | Max:  4m 27s
  🟩 GCC13              Pass: 100%/1   | Total:  3m 54s | Avg:  3m 54s | Max:  3m 54s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 12m 55s | Avg:  4m 18s | Max:  4m 42s
  🟩 GCC                Pass: 100%/3   | Total: 11m 23s | Avg:  3m 47s | Max:  4m 27s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 24m 18s | Avg:  4m 03s | Max:  4m 42s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 24m 18s | Avg:  4m 03s | Max:  4m 42s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 8m 57s | Avg: 4m 28s | Max: 6m 55s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total:  8m 57s | Avg:  4m 28s | Max:  6m 55s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total:  8m 57s | Avg:  4m 28s | Max:  6m 55s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total:  8m 57s | Avg:  4m 28s | Max:  6m 55s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total:  8m 57s | Avg:  4m 28s | Max:  6m 55s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total:  8m 57s | Avg:  4m 28s | Max:  6m 55s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total:  8m 57s | Avg:  4m 28s | Max:  6m 55s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total:  8m 57s | Avg:  4m 28s | Max:  6m 55s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 02s | Avg:  2m 02s | Max:  2m 02s
  🟩 Test               Pass: 100%/1   | Total:  6m 55s | Avg:  6m 55s | Max:  6m 55s

🟩 python: Pass: 100%/1 | Total: 41m 55s | Avg: 41m 55s | Max: 41m 55s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 41m 55s | Avg: 41m 55s | Max: 41m 55s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 41m 55s | Avg: 41m 55s | Max: 41m 55s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 41m 55s | Avg: 41m 55s | Max: 41m 55s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 41m 55s | Avg: 41m 55s | Max: 41m 55s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 41m 55s | Avg: 41m 55s | Max: 41m 55s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 41m 55s | Avg: 41m 55s | Max: 41m 55s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 41m 55s | Avg: 41m 55s | Max: 41m 55s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 41m 55s | Avg: 41m 55s | Max: 41m 55s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 170)

#	Runner
122	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
12	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

leofang · 2025-01-10T06:22:26Z

python/cuda_parallel/cuda/parallel/experimental/_bindings.py

btw I suspect the use of ctypes here contributes to the constant overhead that Ashwin observed...

leofang · 2025-01-10T06:23:42Z

python/cuda_parallel/cuda/parallel/experimental/algorithms/reduce.py

    def __del__(self):
+        if self.build_result is None:
+            return


btw I suppose your _mnff could be applied to here too (not in this PR, ofc) 😉

Add cccl/python/cuda_cccl directory and use from cuda_parallel, cuda_…

daab580

…cooperative

rwgk mentioned this pull request Dec 19, 2024

[FEA]: Introduce Python module with CCCL headers #2281

Open

1 task

leofang reviewed Dec 19, 2024

View reviewed changes

Run copy_cccl_headers_to_aude_include() before setup()

ef9d5f4

Create python/cuda_cccl/cuda/_include/__init__.py, then simply import…

bc116dc

… cuda._include to find the include path.

rwgk added 4 commits December 19, 2024 17:18

Add cuda.cccl._version exactly as for cuda.cooperative and cuda.parallel

2913ae0

Bug fix: cuda/_include only exists after shutil.copytree() ran.

7dbb82b

Use f"cuda-cccl @ file://{cccl_path}/python/cuda_cccl" in setup.py

0703901

Remove CustomBuildCommand, CustomWheelBuild in cuda_parallel/setup.py…

fc0e543

… (they are equivalent to the default functions)

Replace := operator (needs Python 3.8+)

2e64345

rwgk marked this pull request as ready for review December 20, 2024 03:13

rwgk requested review from a team as code owners December 20, 2024 03:13

rwgk requested review from jrhemstad and miscco and removed request for miscco and jrhemstad December 20, 2024 03:13

rwgk added 3 commits December 27, 2024 23:22

Add # TOML lint & format comment.

477fe3b

Replace MANIFEST.in with [tool.setuptools.package-data] section in …

246ddf7

…pyproject.toml

Use pathlib in cuda/cccl/include_paths.py

e1fd264

rwgk requested review from leofang, shwina and vyasr December 29, 2024 04:54

rwgk marked this pull request as ready for review December 29, 2024 05:02

pre-commit autoupdate (EXCEPT clang-format, which was manually restored)

87b46ca

rwgk added 3 commits January 5, 2025 23:31

Merge branch 'main' into pip-cuda-cccl

9597dad

Fixes after git merge main

eddc6cc

vyasr reviewed Jan 7, 2025

View reviewed changes

rwgk added 2 commits January 7, 2025 17:34

Merge branch 'main' into pip-cuda-cccl

c763301

Move copy_cccl_headers_to_cuda_cccl_include() functionality to `cla…

71fd243

…ss CustomBuildPy`

rwgk marked this pull request as draft January 8, 2025 03:08

Introduce cuda_cooperative/constraints.txt

79057cf

shwina mentioned this pull request Jan 8, 2025

Audit and update build/test requirements for cuda.parallel and cuda.cooperative #3290

Open

rwgk added 3 commits January 8, 2025 20:27

Merge branch 'main' into pip-cuda-cccl

ccaf8a5

Also add cuda_parallel/constraints.txt

46a8329

Add --constraint constraints.txt in ci/test_python.sh

a07222b

leofang reviewed Jan 10, 2025

View reviewed changes

		CCCL_PATH = PROJECT_PATH.parents[1]


		def copy_cccl_headers_to_cuda_cccl_include():

		install_requires=[
		f"cuda-cccl @ file://{CCCL_PYTHON_PATH}/cuda_cccl",

[FEA]: Introduce Python module with CCCL headers #3201

Are you sure you want to change the base?

[FEA]: Introduce Python module with CCCL headers #3201

Conversation

rwgk commented Dec 19, 2024 • edited Loading

Description

copy-pr-bot bot commented Dec 19, 2024

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

leofang Dec 19, 2024 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

leofang Dec 19, 2024 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

leofang commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 19, 2024

rwgk commented Dec 20, 2024

rwgk commented Dec 20, 2024

rwgk commented Dec 20, 2024

rwgk commented Dec 20, 2024

github-actions bot commented Dec 20, 2024

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 29m | Avg: 9m 22s | Max: 36m 14s | Hits: 98%/9814

🟩 cub: Pass: 100%/47 | Total: 7h 03m | Avg: 9m 00s | Max: 31m 24s | Hits: 99%/3124

🟩 thrust: Pass: 100%/46 | Total: 6h 20m | Avg: 8m 16s | Max: 33m 45s | Hits: 99%/9260

🟩 cudax: Pass: 100%/26 | Total: 2h 18m | Avg: 5m 19s | Max: 31m 25s | Hits: 92%/312

🟩 cccl: Pass: 100%/6 | Total: 27m 15s | Avg: 4m 32s | Max: 4m 51s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 04s | Avg: 5m 02s | Max: 8m 04s

🟩 python: Pass: 100%/1 | Total: 44m 12s | Avg: 44m 12s | Max: 44m 12s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 176)

rwgk commented Dec 28, 2024

github-actions bot commented Dec 28, 2024

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 47m | Avg: 9m 43s | Max: 28m 40s | Hits: 87%/9814

🟩 cub: Pass: 100%/47 | Total: 7h 14m | Avg: 9m 14s | Max: 36m 31s | Hits: 99%/3144

🟩 thrust: Pass: 100%/46 | Total: 6h 31m | Avg: 8m 30s | Max: 27m 15s | Hits: 99%/9260

🟩 cudax: Pass: 100%/26 | Total: 2h 07m | Avg: 4m 53s | Max: 19m 50s | Hits: 92%/312

🟩 cccl: Pass: 100%/6 | Total: 24m 24s | Avg: 4m 04s | Max: 4m 35s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 34s | Avg: 4m 47s | Max: 7m 31s

🟩 python: Pass: 100%/1 | Total: 45m 40s | Avg: 45m 40s | Max: 45m 40s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 176)

rwgk commented Dec 28, 2024

github-actions bot commented Dec 28, 2024

🟩 libcudacxx: Pass: 100%/48 | Total: 7h 12m | Avg: 9m 01s | Max: 27m 15s | Hits: 99%/9814

🟩 cub: Pass: 100%/47 | Total: 7h 24m | Avg: 9m 27s | Max: 36m 19s | Hits: 99%/3144

🟩 thrust: Pass: 100%/46 | Total: 6h 37m | Avg: 8m 38s | Max: 32m 50s | Hits: 99%/9260

🟩 cudax: Pass: 100%/26 | Total: 2h 10m | Avg: 5m 02s | Max: 22m 58s | Hits: 92%/312

🟩 cccl: Pass: 100%/6 | Total: 24m 14s | Avg: 4m 02s | Max: 4m 42s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 24s | Avg: 4m 42s | Max: 7m 27s

🟩 python: Pass: 100%/1 | Total: 44m 32s | Avg: 44m 32s | Max: 44m 32s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 176)

github-actions bot commented Dec 29, 2024

🟩 libcudacxx: Pass: 100%/48 | Total: 6h 46m | Avg: 8m 28s | Max: 31m 05s | Hits: 99%/9814

🟩 cub: Pass: 100%/47 | Total: 7h 14m | Avg: 9m 15s | Max: 32m 21s | Hits: 99%/3144

🟩 thrust: Pass: 100%/46 | Total: 6h 14m | Avg: 8m 08s | Max: 25m 39s | Hits: 99%/9260

🟩 cudax: Pass: 100%/26 | Total: 2h 13m | Avg: 5m 08s | Max: 22m 23s | Hits: 92%/312

🟩 cccl: Pass: 100%/6 | Total: 25m 04s | Avg: 4m 10s | Max: 4m 38s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 14s | Avg: 5m 07s | Max: 8m 11s

🟩 python: Pass: 100%/1 | Total: 44m 41s | Avg: 44m 41s | Max: 44m 41s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 176)

github-actions bot commented Jan 6, 2025

rwgk commented Dec 19, 2024 •

edited

Loading

leofang Dec 19, 2024 •

edited

Loading

leofang Dec 19, 2024 •

edited

Loading