examples/Makefile

# CONFIGURATION
#   GTENSOR_DEVICE - cuda, hip, or host (default cuda)
#   GTENSOR_CXX - override default compiler (default is device dependent)
#   ROCM_PATH - for hip device, override default rocm path (default /opt/rocm)

# gtensor configuration
# TODO: add example recipe to auto-fetch gtensor
GTENSOR_DIR = external/gtensor
GTENSOR_DEVICE ?= cuda

GTENSOR_HEADERS = $(wildcard $(GTENSOR_DIR)/include/*.h)

GTENSOR_DEVICE_DEFINE := GTENSOR_DEVICE_$(shell echo $(GTENSOR_DEVICE) | tr a-z A-Z)
GTENSOR_DEFINES = -D$(GTENSOR_DEVICE_DEFINE)
GTENSOR_INCLUDES = -I$(GTENSOR_DIR)/include
GTENSOR_LIBS =
GTENSOR_OPTIONS = -std=c++14 -O2
ifeq ($(GTENSOR_DEVICE),cuda)
  GTENSOR_CXX ?= nvcc
  GTENSOR_OPTIONS += -x cu --expt-extended-lambda --expt-relaxed-constexpr
  GTENSOR_DEFINES += -DGTENSOR_HAVE_DEVICE
else ifeq ($(GTENSOR_DEVICE),hip)
  ROCM_PATH ?= /opt/rocm
  AMDGPU_TARGET = gfx803
  GTENSOR_CXX ?= $(ROCM_PATH)/bin/hipcc
  HIP_HAS_HC = $(shell $(GTENSOR_CXX) --help | grep ' \-hc ')
  ifeq ($(strip $(HIP_HAS_HC)),)
    GTENSOR_OPTIONS += -x hip
  else
    GTENSOR_OPTIONS += -hc -amdgpu-target=$(AMDGPU_TARGET)
  endif
  # Note: HIP doesn't support assert in device code
  GTENSOR_DEFINES += -DGTENSOR_HAVE_DEVICE -DNDEBUG
  GTENSOR_INCLUDES += -isystem $(ROCM_PATH)/include -isystem $(ROCM_PATH)/hip/include -isystem $(ROCM_PATH)/rocprim/include -isystem $(ROCM_PATH)/rocthrust/include
else ifeq ($(GTENSOR_DEVICE),sycl)
  ONEAPI_PATH ?= /opt/intel/oneapi
  GTENSOR_CXX ?= $(ONEAPI_PATH)/compiler/latest/linux/bin/dpcpp
  GTENSOR_OPTIONS = -fsycl -std=c++17 -O2
  # Note: SYCL doesn't support assert in device code
  GTENSOR_DEFINES += -DGTENSOR_HAVE_DEVICE -DNDEBUG
else
  GTENSOR_CXX ?= clang++
endif

GTENSOR_FLAGS = $(GTENSOR_DEFINES) $(GTENSOR_INCLUDES) $(GTENSOR_LIBS) $(GTENSOR_OPTIONS)

# targets using gtensor
GTENSOR_TARGETS = daxpy stencil1d mult_table
ifeq ($(GTENSOR_DEVICE),cuda)
  GTENSOR_TARGETS += trig_adapted
endif
ifneq ($(GTENSOR_ENABLE_FORTRAN),)
  FC := gfortran
  FCFLAGS := -I$(GTENSOR_DIR)/include/gtensor/fortran
  FLIBS := $(shell $(FC) --print-file-name=libgfortran.dylib)
  FLIBS += $(shell $(FC) --print-libgcc-file-name)
  GTENSOR_LIBS += $(GTENSOR_DIR)/lib/libfgtensor.a
  GTENSOR_TARGETS += test_fortran
endif

.PHONY: all
all: $(GTENSOR_TARGETS)

% : src/%.cxx $(GTENSOR_HEADERS)
	$(GTENSOR_CXX) $(GTENSOR_FLAGS) -o $@ $<

test_fortran: src/test_fortran.o src/c_test_fortran.o
	$(GTENSOR_CXX) $^ $(FLIBS) $(GTENSOR_LIBS) -o $@

src/%.o: src/%.F90
	$(FC) $(FCFLAGS) -c $< -o $@

src/%.o: src/%.cxx
	$(GTENSOR_CXX) $(GTENSOR_FLAGS) -c $< -o $@

.PHONY: clean
clean:
	rm -rf $(GTENSOR_TARGETS)