LabKey
diff --git a/‎SequenceAnalysis/resources/web/SequenceAnalysis/panel/BaseSequencePanel.js‎
Lines changed: 20 additions & 0 deletions b/‎SequenceAnalysis/resources/web/SequenceAnalysis/panel/BaseSequencePanel.js‎
Lines changed: 20 additions & 0 deletions
diff --git a/‎SequenceAnalysis/resources/web/SequenceAnalysis/panel/SequenceAnalysisPanel.js‎
Lines changed: 1 addition & 2 deletions b/‎SequenceAnalysis/resources/web/SequenceAnalysis/panel/SequenceAnalysisPanel.js‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/ProcessVariantsHandler.java‎
Lines changed: 8 additions & 1 deletion b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/ProcessVariantsHandler.java‎
Lines changed: 8 additions & 1 deletion
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/ReadsetInitTask.java‎
Lines changed: 61 additions & 0 deletions b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/ReadsetInitTask.java‎
Lines changed: 61 additions & 0 deletions
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/VariantProcessingJob.java‎
Lines changed: 1 addition & 1 deletion b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/pipeline/VariantProcessingJob.java‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/run/analysis/PbsvJointCallingHandler.java‎
Lines changed: 1 addition & 1 deletion b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/run/analysis/PbsvJointCallingHandler.java‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/run/variant/KingInferenceStep.java‎
Lines changed: 3 additions & 6 deletions b/‎SequenceAnalysis/src/org/labkey/sequenceanalysis/run/variant/KingInferenceStep.java‎
Lines changed: 3 additions & 6 deletions
diff --git a/‎jbrowse/test/src/org/labkey/test/tests/external/labModules/JBrowseTest.java‎
Lines changed: 1 addition & 0 deletions b/‎jbrowse/test/src/org/labkey/test/tests/external/labModules/JBrowseTest.java‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎singlecell/resources/chunks/AvgExpression.R‎
Lines changed: 9 additions & 19 deletions b/‎singlecell/resources/chunks/AvgExpression.R‎
Lines changed: 9 additions & 19 deletions
diff --git a/‎singlecell/resources/chunks/ClrNormalizeByGroup.R‎
Lines changed: 1 addition & 1 deletion b/‎singlecell/resources/chunks/ClrNormalizeByGroup.R‎
Lines changed: 1 addition & 1 deletion
@@ -269,6 +269,10 @@ Ext4.define('SequenceAnalysis.panel.BaseSequencePanel', {
                                         Ext4.defer(field.focus, 200, field);
                                     }
                                 }
+                            },{
+                                xtype: 'checkbox',
+                                itemId: 'useReadsetContainer',
+                                fieldLabel: 'Submit Jobs to Same Folder/Workbook as Readset'
                             }]
                         }],
                         buttons: [{
@@ -294,6 +298,12 @@ Ext4.define('SequenceAnalysis.panel.BaseSequencePanel', {
                                     json = Ext4.decode(json);
                                 }
 
+                                var useReadsetContainer = win.down('#useReadsetContainer').getValue();
+                                if (!useReadsetContainer) {
+                                    delete json.useOutputFileContainer;
+                                    delete json.submitJobToReadsetContainer;
+                                }
+
                                 win.sequencePanel.applySavedValues(json);
                                 win.close();
                             }
@@ -354,5 +364,15 @@ Ext4.define('SequenceAnalysis.panel.BaseSequencePanel', {
         Ext4.Array.forEach(sections, function(s){
             s.applySavedValues(values);
         }, this);
+
+        // For top-level properties:
+        Ext4.Array.forEach(['submissionType', 'useOutputFileContainer', 'submitJobToReadsetContainer'], function(val) {
+            if (values[val]) {
+                var field = this.down('[name="' + val + '"]');
+                if (field) {
+                    field.setValue(values[val]);
+                }
+            }
+        }, this);
     }
 });
@@ -318,9 +318,8 @@ Ext4.define('SequenceAnalysis.panel.SequenceAnalysisPanel', {
                 checked: false,
                 xtype: 'checkbox'
             }, this.getSaveTemplateCfg(),{
-                fieldLabel: 'Submit Jobs To Same Container As Readset?',
+                fieldLabel: 'Submit Jobs To Same Folder/Workbook As Readset?',
                 helpPopup: 'If checked, each alignment job will be submitted to the container/workbook of the parent readset, rather than this container',
-                hidden: !LABKEY.Security.currentUser.isAdmin,
                 name: 'submitJobToReadsetContainer',
                 inputValue: true,
                 uncheckedValue: false,
 
@@ -677,8 +677,15 @@ private void processFile(File input, Integer libraryId, Integer readsetId, JobCo
                     so1.setCreated(new Date());
                     so1.setModified(new Date());
                     so1.setReadset(readsetId);
-                    so1.setDescription("Total samples: " + sampleCount);
+                    String description = "Total samples: " + sampleCount;
 
+                    String extraDescription = StringUtils.trimToNull(ctx.getParams().optString("jobDescription"));
+                    if (extraDescription != null)
+                    {
+                        description = description + '\n' + extraDescription;
+                    }
+
+                    so1.setDescription(description);
                     _resumer.getFileManager().addSequenceOutput(so1);
                 }
             }
 
@@ -27,6 +27,7 @@
 import org.labkey.api.pipeline.RecordedAction;
 import org.labkey.api.pipeline.RecordedActionSet;
 import org.labkey.api.pipeline.WorkDirectoryTask;
+import org.labkey.api.sequenceanalysis.SequenceAnalysisService;
 import org.labkey.api.sequenceanalysis.pipeline.TaskFileManager;
 import org.labkey.api.util.Compress;
 import org.labkey.api.util.FileType;
@@ -45,8 +46,10 @@
 import java.util.Arrays;
 import java.util.Collection;
 import java.util.Collections;
+import java.util.HashMap;
 import java.util.HashSet;
 import java.util.List;
+import java.util.Map;
 import java.util.Set;
 
 /**
@@ -163,6 +166,8 @@ public RecordedActionSet run() throws PipelineJobException
             List<FileGroup> fileGroups = getHelper().getSettings().getFileGroups(getPipelineJob());
             List<SequenceReadsetImpl> readsets = getHelper().getSettings().getReadsets(getPipelineJob());
 
+            checkForDuplicateFileNames(readsets, fileGroups);
+
             if (!SequenceNormalizationTask.shouldRunRemote(getJob()))
             {
                 getJob().getLogger().info("No files required external normalization, processing inputs locally");
@@ -486,5 +491,61 @@ private static void moveInputToAnalysisDir(File input, SequenceJob job, Collecti
             throw new PipelineJobException(e);
         }
     }
+
+    private void checkForDuplicateFileNames(List<SequenceReadsetImpl> readsets, List<FileGroup> fileGroups) throws PipelineJobException
+    {
+        // check for duplicate filename between incoming and existing
+        for (SequenceReadsetImpl r : readsets)
+        {
+            boolean readsetExists = r.getReadsetId() != null && r.getReadsetId() > 0;
+            SequenceReadsetImpl existingReadset = readsetExists ? ((SequenceReadsetImpl) SequenceAnalysisService.get().getReadset(r.getReadsetId(), getJob().getUser())) : null;
+            List<ReadDataImpl> preexistingReadData = readsetExists ? existingReadset.getReadDataImpl() : Collections.emptyList();
+            if (!preexistingReadData.isEmpty())
+            {
+                Map<String, File> existingFileNames = new HashMap<>();
+                preexistingReadData.forEach(rd -> {
+                    existingFileNames.put(rd.getFile1().getName(), rd.getFile1());
+                    if (rd.getFile2() != null)
+                    {
+                        existingFileNames.put(rd.getFile2().getName(), rd.getFile2());
+                    }
+                });
+
+                Map<String, File> sharedFns = new HashMap<>();
+                for (FileGroup fg : fileGroups)
+                {
+                    if (r.getFileSetName() != null && r.getFileSetName().equals(fg.name))
+                    {
+                        for (FileGroup.FilePair fp : fg.filePairs)
+                        {
+                            if (existingFileNames.containsKey(fp.file1.getName()))
+                            {
+                                sharedFns.put(fp.file1.getName(), fp.file1);
+                            }
+
+                            if (fp.file2 != null && existingFileNames.containsKey(fp.file2.getName()))
+                            {
+                                sharedFns.put(fp.file2.getName(), fp.file2);
+                            }
+                        }
+                    }
+                }
+
+                if (!sharedFns.isEmpty())
+                {
+                    getJob().getLogger().debug("Duplicate file names found between incoming and existing for: " + r.getName());
+                    for (String newFile : sharedFns.keySet())
+                    {
+                        long diff = Math.abs(sharedFns.get(newFile).length() - existingFileNames.get(newFile).length());
+                        getJob().getLogger().debug("File name: " + newFile + ", with size difference: " + diff);
+                        if (diff < 100)
+                        {
+                            throw new PipelineJobException("Identical filenames with nearly identical size detected between existing and new files for readset: " + r.getName());
+                        }
+                    }
+                }
+            }
+        }
+    }
 }
 
@@ -159,7 +159,7 @@ else if (_scatterGatherMethod == VariantProcessingStep.ScatterGatherMethod.fixed
 
     public boolean doAllowSplitContigs()
     {
-        return getParameterJson().optBoolean("scatterGather.allowSplitChromosomes", true);
+        return getParameterJson().optBoolean("scatterGather.allowSplitChromosomes", false);
     }
 
     public boolean isScatterJob()
 
@@ -248,7 +248,7 @@ private File runPbsvCall(JobContext ctx, List<File> inputs, ReferenceGenome geno
 
                 for (File s : inputs)
                 {
-                    String ret = StringUtils.trimToNull(runner.executeWithOutput(Arrays.asList("/bin/bash", "-c", tabix.getExe().getPath() + " -l '" + s.getPath() + "' | awk ' { $1 == \"" + contig + "\" } ' | wc -l")));
+                    String ret = StringUtils.trimToNull(runner.executeWithOutput(Arrays.asList("/bin/bash", "-c", tabix.getExe().getPath() + " -l '" + s.getPath() + "' | awk ' $1 == \"" + contig + "\" ' | wc -l")));
                     if ("0".equals(ret))
                     {
                         ctx.getLogger().info("Sample is missing contig: " + contig + ", skipping: " + s.getPath());
 
@@ -64,7 +64,7 @@ public Output processVariants(File inputVCF, File outputDirectory, ReferenceGeno
 
         File plinkOut = new File(outputDirectory, "plink");
         output.addIntermediateFile(new File(plinkOut.getPath() + ".bed"));
-        output.addIntermediateFile(new File(plinkOut.getPath() + ".fam"));
+        //output.addIntermediateFile(new File(plinkOut.getPath() + ".fam"));
         output.addIntermediateFile(new File(plinkOut.getPath() + ".bim"));
         output.addIntermediateFile(new File(plinkOut.getPath() + ".log"));
         output.addIntermediateFile(new File(plinkOut.getPath() + "-temporary.psam"));
@@ -90,11 +90,8 @@ public Output processVariants(File inputVCF, File outputDirectory, ReferenceGeno
             plinkArgs.add("--chr");
             plinkArgs.add(StringUtils.join(toKeep, ","));
         }
-        else
-        {
-            plinkArgs.add("--allow-extra-chr");
-        }
 
+        plinkArgs.add("--allow-extra-chr");
         plinkArgs.add("--silent");
 
         plinkArgs.add("--max-alleles");
@@ -138,7 +135,7 @@ public Output processVariants(File inputVCF, File outputDirectory, ReferenceGeno
             kingArgs.add(threads.toString());
         }
 
-        kingArgs.add("--kinship");
+        kingArgs.add("--related");
 
         File kinshipOutput = new File(outputDirectory, SequenceAnalysisService.get().getUnzippedBaseName(inputVCF.getName()) + ".kin");
         wrapper.execute(kingArgs);
 
@@ -870,6 +870,7 @@ private void testGridFailureConditions()
     private void testVariantTableComparators() throws Exception {
         beginAt("/home/jbrowse-variantTable.view?session=mgap&trackId=mgap_hg38&location=1:116589678..117411688");
         waitForElement(Locator.tagWithClass("div", "MuiDataGrid-root"));
+        waitForElement(Locator.tagWithText("div", "116981270")); //proxy for grid loading
 
         // Test filtering AF with wrapped comparators
         waitAndClick(Locator.tagWithAttributeContaining("button", "aria-label", "Show filters"));
 
@@ -1,3 +1,11 @@
+if (!file.exists('/homeDir/.netrc')) {
+    print(list.files('/homeDir'))
+    stop('Unable to find file: /homeDir/.netrc')
+}
+
+invisible(Rlabkey::labkey.setCurlOptions(NETRC_FILE = '/homeDir/.netrc'))
+Rdiscvr::SetLabKeyDefaults(baseUrl = serverBaseUrl, defaultFolder = defaultLabKeyFolder)
+
 GenerateAveragedData <- function(seuratObj, groupFields, addMetadata) {
     if (addMetadata && !'cDNA_ID' %in% names(seuratObj@meta.data)) {
         stop('A field names cDNA_ID must exist when addMetadata=TRUE')
@@ -7,25 +15,7 @@ GenerateAveragedData <- function(seuratObj, groupFields, addMetadata) {
         stop('When addMetadata=TRUE, cDNA_ID must be part of groupFields')
     }
 
-    meta <- unique(seuratObj@meta.data[,groupFields, drop = F])
-    rownames(meta) <- apply(meta, 1, function(y){
-        return(paste0(y, collapse = '_'))
-    })
-
-    Seurat::Idents(seuratObj) <- rownames(meta)
-
-    for (assayName in names(seuratObj@assays)) {
-        if (!(!identical(seuratObj@assays[[assayName]]@counts, seuratObj@assays[[assayName]]@data))){
-            print(paste0('Seurat assay', assayName, ' does not appear to be normalized, running now:'))
-            seuratObj <- Seurat::NormalizeData(seuratObj, verbose = FALSE, assay = assayName)
-        }
-    }
-
-    a <- Seurat::AverageExpression(seuratObj, return.seurat = T, verbose = F)
-    a <- Seurat::AddMetaData(a, meta)
-
-    totals <- seuratObj@meta.data %>% group_by_at(groupFields) %>% summarise(TotalCells = n())
-    a$TotalCells <- totals$TotalCells
+    a <- CellMembrane::PseudobulkSeurat(seuratObj, groupFields = groupFields, assays = assayName)
 
     if (addMetadata) {
         a <- Rdiscvr::QueryAndApplyMetadataUsingCDNA(a)
 
@@ -1,7 +1,7 @@
 for (datasetId in names(seuratObjects)) {
     printName(datasetId)
     seuratObj <- readRDS(seuratObjects[[datasetId]])
-    seuratObj <- CellMembrane::ClrNormalizeByGroup(seuratObj, groupingVar = groupingVar, assayName = assayName, targetAssayName = targetAssayName, margin = margin, minCellsPerGroup = minCellsPerGroup, calculatePerFeatureUCell = calculatePerFeatureUCell, featureInclusionList = featureWhitelist, featureExclusionList = featureExclusionList)
+    seuratObj <- CellMembrane::ClrNormalizeByGroup(seuratObj, groupingVar = groupingVar, assayName = assayName, targetAssayName = targetAssayName, margin = margin, minCellsPerGroup = minCellsPerGroup, calculatePerFeatureUCell = calculatePerFeatureUCell, featureInclusionList = featureWhitelist, featureExclusionList = featureExclusionList, doAsinhTransform = doAsinhTransform)
 
     saveData(seuratObj, datasetId)
Original file line number	Diff line number	Diff line change
`@@ -159,7 +159,7 @@ else if (_scatterGatherMethod == VariantProcessingStep.ScatterGatherMethod.fixed`
`159`	`159`
`160`	`160`	`public boolean doAllowSplitContigs()`
`161`	`161`	`{`
`162`		`- return getParameterJson().optBoolean("scatterGather.allowSplitChromosomes", true);`
	`162`	`+ return getParameterJson().optBoolean("scatterGather.allowSplitChromosomes", false);`
`163`	`163`	`}`
`164`	`164`
`165`	`165`	`public boolean isScatterJob()`
Original file line number	Diff line number	Diff line change
`@@ -248,7 +248,7 @@ private File runPbsvCall(JobContext ctx, List<File> inputs, ReferenceGenome geno`
`248`	`248`
`249`	`249`	`for (File s : inputs)`
`250`	`250`	`{`
`251`		`- String ret = StringUtils.trimToNull(runner.executeWithOutput(Arrays.asList("/bin/bash", "-c", tabix.getExe().getPath() + " -l '" + s.getPath() + "' \| awk ' { $1 == \"" + contig + "\" } ' \| wc -l")));`
	`251`	`+ String ret = StringUtils.trimToNull(runner.executeWithOutput(Arrays.asList("/bin/bash", "-c", tabix.getExe().getPath() + " -l '" + s.getPath() + "' \| awk ' $1 == \"" + contig + "\" ' \| wc -l")));`
`252`	`252`	`if ("0".equals(ret))`
`253`	`253`	`{`
`254`	`254`	`ctx.getLogger().info("Sample is missing contig: " + contig + ", skipping: " + s.getPath());`