From a1dcfc384524b884025d607a5ebc67a8b30681ca Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Karl=20Sv=C3=A4rd?=
 <60181709+Karl-Svard@users.noreply.github.com>
Date: Wed, 25 Sep 2024 16:53:21 +0200
Subject: [PATCH] Update library normalization script to work with the new
 Watchmaker LIMS workflow  (#533)(minor)

### Changed
- Re-named pool-normalization EPP to library-normalization
- Added new CLI flags for specifying UDF names in library-normalization
---
 cg_lims/EPPs/udf/calculate/base.py            |  4 +-
 ...malization.py => library_normalization.py} | 87 ++++++++++++-------
 cg_lims/options.py                            | 12 +++
 3 files changed, 68 insertions(+), 35 deletions(-)
 rename cg_lims/EPPs/udf/calculate/{pool_normalization.py => library_normalization.py} (62%)

diff --git a/cg_lims/EPPs/udf/calculate/base.py b/cg_lims/EPPs/udf/calculate/base.py
index 467c0c46..130a51a1 100644
--- a/cg_lims/EPPs/udf/calculate/base.py
+++ b/cg_lims/EPPs/udf/calculate/base.py
@@ -19,13 +19,13 @@
 from cg_lims.EPPs.udf.calculate.calculate_water import volume_water
 from cg_lims.EPPs.udf.calculate.calculate_water_volume_rna import calculate_water_volume_rna
 from cg_lims.EPPs.udf.calculate.get_missing_reads import get_missing_reads
+from cg_lims.EPPs.udf.calculate.library_normalization import library_normalization
 from cg_lims.EPPs.udf.calculate.maf_calculate_volume import maf_calculate_volume
 from cg_lims.EPPs.udf.calculate.molar_concentration import molar_concentration
 from cg_lims.EPPs.udf.calculate.novaseq_x_denaturation import novaseq_x_denaturation
 from cg_lims.EPPs.udf.calculate.novaseq_x_volumes import novaseq_x_volumes
 from cg_lims.EPPs.udf.calculate.ont_aliquot_volume import ont_aliquot_volume
 from cg_lims.EPPs.udf.calculate.ont_sequencing_reload import ont_available_sequencing_reload
-from cg_lims.EPPs.udf.calculate.pool_normalization import pool_normalization
 from cg_lims.EPPs.udf.calculate.qpcr_concentration import qpcr_concentration
 from cg_lims.EPPs.udf.calculate.sum_missing_reads_in_pool import missing_reads_in_pool
 from cg_lims.EPPs.udf.calculate.twist_aliquot_amount import twist_aliquot_amount
@@ -61,7 +61,7 @@ def calculate(ctx):
 calculate.add_command(calculate_microbial_aliquot_volumes)
 calculate.add_command(calculate_average_size_and_set_qc)
 calculate.add_command(novaseq_x_volumes)
-calculate.add_command(pool_normalization)
+calculate.add_command(library_normalization)
 calculate.add_command(novaseq_x_denaturation)
 calculate.add_command(qpcr_concentration)
 calculate.add_command(calculate_saphyr_concentration)
diff --git a/cg_lims/EPPs/udf/calculate/pool_normalization.py b/cg_lims/EPPs/udf/calculate/library_normalization.py
similarity index 62%
rename from cg_lims/EPPs/udf/calculate/pool_normalization.py
rename to cg_lims/EPPs/udf/calculate/library_normalization.py
index 204ad956..c3de2873 100644
--- a/cg_lims/EPPs/udf/calculate/pool_normalization.py
+++ b/cg_lims/EPPs/udf/calculate/library_normalization.py
@@ -3,8 +3,10 @@
 from typing import List, Optional
 
 import click
-from cg_lims.exceptions import InvalidValueError, LimsError, MissingUDFsError
+from cg_lims import options
+from cg_lims.exceptions import InvalidValueError, LimsError, MissingValueError
 from cg_lims.get.artifacts import get_artifacts
+from cg_lims.get.udfs import get_udf
 from genologics.entities import Artifact, Process
 
 LOG = logging.getLogger(__name__)
@@ -13,38 +15,22 @@
 
 def get_final_concentration(process: Process, final_concentration_udf: str) -> float:
     """Return final concentration value from process."""
-    final_concentration: Optional[float] = process.udf.get(final_concentration_udf)
-    if not final_concentration:
-        error_message: str = (
-            f"Process {process.id} is missing a value for UDF '{final_concentration_udf}'."
-        )
-        LOG.error(error_message)
-        raise MissingUDFsError(error_message)
-    return final_concentration
+    return float(get_udf(entity=process, udf=final_concentration_udf))
 
 
 def get_artifact_concentration(artifact: Artifact, concentration_udf: str) -> float:
     """Return concentration value from artifact."""
-    concentration: Optional[float] = artifact.udf.get(concentration_udf)
-    if not concentration:
-        error_message: str = (
-            f"Artifact {artifact.id} is missing a value for UDF '{concentration_udf}'."
-        )
-        LOG.error(error_message)
-        raise MissingUDFsError(error_message)
-    return concentration
+    return float(get_udf(entity=artifact, udf=concentration_udf))
 
 
 def get_total_volume(artifact: Artifact, total_volume_udf: str) -> float:
     """Return total volume value from artifact."""
-    total_volume: Optional[float] = artifact.udf.get(total_volume_udf)
-    if not total_volume:
-        error_message: str = (
-            f"Artifact {artifact.id} is missing a value for UDF '{total_volume_udf}'."
-        )
-        LOG.error(error_message)
-        raise MissingUDFsError(error_message)
-    return total_volume
+    return float(get_udf(entity=artifact, udf=total_volume_udf))
+
+
+def get_process_total_volume(process: Process, total_volume_udf: str) -> Optional[float]:
+    """Return total volume value from process."""
+    return process.udf.get(total_volume_udf)
 
 
 def calculate_sample_volume(
@@ -76,7 +62,8 @@ def calculate_buffer_volume(total_volume: float, sample_volume: float) -> float:
 def set_artifact_volumes(
     artifacts: List[Artifact],
     final_concentration: float,
-    total_volume_udf: str,
+    total_volume: Optional[float],
+    total_volume_udf: Optional[str],
     sample_volume_udf: str,
     buffer_volume_udf: str,
     concentration_udf: str,
@@ -86,7 +73,16 @@ def set_artifact_volumes(
         sample_concentration: float = get_artifact_concentration(
             artifact=artifact, concentration_udf=concentration_udf
         )
-        total_volume: float = get_total_volume(artifact=artifact, total_volume_udf=total_volume_udf)
+        if not total_volume_udf and not total_volume:
+            error_message = (
+                "The calculation needs either a total volume value or UDF name to be given!"
+            )
+            LOG.error(error_message)
+            raise MissingValueError(error_message)
+        elif total_volume_udf and not total_volume:
+            total_volume: float = get_total_volume(
+                artifact=artifact, total_volume_udf=total_volume_udf
+            )
         sample_volume: float = calculate_sample_volume(
             final_concentration=final_concentration,
             artifact=artifact,
@@ -102,8 +98,26 @@ def set_artifact_volumes(
 
 
 @click.command()
+@options.sample_udf(help="Name of sample volume UDF.")
+@options.buffer_udf(help="Name of buffer volume UDF.")
+@options.concentration_udf(help="Name of sample concentration UDF.")
+@options.final_concentration_udf(help="Name of final target concentration UDF.")
+@options.total_volume_udf(
+    help="Name of total volume UDF on sample level. Note: Can't be combined with the process level alternative."
+)
+@options.total_volume_process_udf(
+    help="Name of total volume UDF on process level. Note: Can't be combined with the sample level alternative."
+)
 @click.pass_context
-def pool_normalization(ctx: click.Context):
+def library_normalization(
+    ctx: click.Context,
+    sample_udf: str,
+    buffer_udf: str,
+    concentration_udf: str,
+    final_concentration_udf: str,
+    total_volume_udf: Optional[str] = None,
+    total_volume_pudf: Optional[str] = None,
+) -> None:
     """Calculate and set volumes needed for normalization of pool before sequencing."""
 
     LOG.info(f"Running {ctx.command_path} with params: {ctx.params}")
@@ -111,15 +125,22 @@ def pool_normalization(ctx: click.Context):
     artifacts: List[Artifact] = get_artifacts(process=process)
     try:
         final_concentration: float = get_final_concentration(
-            process=process, final_concentration_udf="Final Concentration (nM)"
+            process=process, final_concentration_udf=final_concentration_udf
         )
+        if total_volume_pudf:
+            total_volume: Optional[float] = get_process_total_volume(
+                process=process, total_volume_udf=total_volume_pudf
+            )
+        else:
+            total_volume = None
         set_artifact_volumes(
             artifacts=artifacts,
             final_concentration=final_concentration,
-            total_volume_udf="Total Volume (uL)",
-            sample_volume_udf="Sample Volume (ul)",
-            buffer_volume_udf="Volume Buffer (ul)",
-            concentration_udf="Concentration (nM)",
+            total_volume=total_volume,
+            total_volume_udf=total_volume_udf,
+            sample_volume_udf=sample_udf,
+            buffer_volume_udf=buffer_udf,
+            concentration_udf=concentration_udf,
         )
         if failed_samples:
             failed_samples_string = ", ".join(failed_samples)
diff --git a/cg_lims/options.py b/cg_lims/options.py
index c51464d5..6d8cdfb0 100644
--- a/cg_lims/options.py
+++ b/cg_lims/options.py
@@ -295,6 +295,12 @@ def concentration_udf(
     return click.option("--concentration-udf", required=True, help=help)
 
 
+def final_concentration_udf(
+    help: str = "String of UDF used to get final concentration value",
+) -> click.option:
+    return click.option("--final-concentration-udf", required=True, help=help)
+
+
 def prep(help: str = "Prep type") -> click.option:
     return click.option(
         "--prep-type",
@@ -439,6 +445,12 @@ def total_volume_udf(
     return click.option("--total-volume-udf", required=False, help=help)
 
 
+def total_volume_process_udf(
+    help: str = "String of process UDF used to get the total volume from a process",
+) -> click.option:
+    return click.option("--total-volume-pudf", required=False, help=help)
+
+
 def well_udf(help: str = "UDF name for artifact well.") -> click.option:
     return click.option("--well-udf", required=False, default=None, help=help)