Merge branch 'fix_particle_sorting' into nodal_aux_3

author: Weiqun Zhang <weiqunzhang@lbl.gov> 2019-10-11 19:53:11 -0700
committer: Weiqun Zhang <weiqunzhang@lbl.gov> 2019-10-11 19:53:11 -0700
commit: ded6dd2cb05a76e1df9ab8561148f00d5e0bd365 (patch)
tree: dc813a3ba2cc5eafb925cbf31498fadd0b26a275 /Source/Parallelization/WarpXComm.cpp
parent: 358a8aa9fc550709e0f24a202f06a696be31ae93 (diff)
parent: d0b0c0940205a71534b96c4649aeffd983c4f9cf (diff)
download: WarpX-ded6dd2cb05a76e1df9ab8561148f00d5e0bd365.tar.gz
WarpX-ded6dd2cb05a76e1df9ab8561148f00d5e0bd365.tar.zst
WarpX-ded6dd2cb05a76e1df9ab8561148f00d5e0bd365.zip
1 files changed, 18 insertions, 17 deletions
diff --git a/Source/Parallelization/WarpXComm.cpp b/Source/Parallelization/WarpXComm.cpp
index c5a8877d3..52df3dc25 100644
--- a/Source/Parallelization/WarpXComm.cpp
+++ b/Source/Parallelization/WarpXComm.cpp
@@ -3,10 +3,12 @@
 #include <WarpX_f.H>
 #include <WarpXSumGuardCells.H>
 #include <Parallelization/InterpolateCurrentFineToCoarse.H>
+#include <Parallelization/InterpolateDensityFineToCoarse.H>
 
 #include <algorithm>
 #include <cstdlib>
 
+
 using namespace amrex;
 
 void
@@ -505,7 +507,7 @@ WarpX::interpolateCurrentFineToCoarse ( std::array< amrex::MultiFab const *, 3 >
                                         std::array< amrex::MultiFab       *, 3 > const & coarse,
                                         int const refinement_ratio)
 {
-    BL_PROFILE("InterpolateCurrentFineToCoarse()");
+    BL_PROFILE("interpolateCurrentFineToCoarse()");
     BL_ASSERT(refinement_ratio == 2);
     const IntVect& ng = (fine[0]->nGrowVect() + 1) / refinement_ratio; // add equivalent no. of guards to coarse patch
 
@@ -537,6 +539,8 @@ WarpX::interpolateCurrentFineToCoarse ( std::array< amrex::MultiFab const *, 3 >
 void
 WarpX::SyncRho ()
 {
+    BL_PROFILE("SyncRho()");
+
     if (!rho_fp[0]) return;
     const int ncomp = rho_fp[0]->nComp();
 
@@ -546,7 +550,7 @@ WarpX::SyncRho ()
     {
         rho_cp[lev]->setVal(0.0);
         const IntVect& refinement_ratio = refRatio(lev-1);
-        SyncRho(*rho_fp[lev], *rho_cp[lev], refinement_ratio[0]);
+        interpolateDensityFineToCoarse(*rho_fp[lev], *rho_cp[lev], refinement_ratio[0]);
     }
 
     // For each level
@@ -559,29 +563,26 @@ WarpX::SyncRho ()
 }
 
 void
-WarpX::SyncRho (const MultiFab& fine, MultiFab& crse, int refinement_ratio)
+WarpX::interpolateDensityFineToCoarse (const MultiFab& fine, MultiFab& coarse, int const refinement_ratio)
 {
+    BL_PROFILE("interpolateDensityFineToCoarse()");
     BL_ASSERT(refinement_ratio == 2);
-    const IntVect& ng = (fine.nGrowVect()+1)/refinement_ratio;
+    const IntVect& ng = (fine.nGrowVect() + 1) / refinement_ratio;  // add equivalent no. of guards to coarse patch
     const int nc = fine.nComp();
 
 #ifdef _OPEMP
 #pragma omp parallel if (Gpu::notInLaunchRegion())
 #endif
     {
-        FArrayBox ffab;
-        for (MFIter mfi(crse,true); mfi.isValid(); ++mfi)
+        // OMP in-box decomposition of coarse into tilebox
+        for (MFIter mfi(coarse, TilingIfNotGPU()); mfi.isValid(); ++mfi)
         {
-            const Box& bx = mfi.growntilebox(ng);
-            Box fbx = amrex::grow(amrex::refine(bx,refinement_ratio),1);
-            ffab.resize(fbx, nc);
-            fbx &= fine[mfi].box();
-            ffab.setVal(0.0);
-            ffab.copy(fine[mfi], fbx, 0, fbx, 0, nc);
-            WRPX_SYNC_RHO(bx.loVect(), bx.hiVect(),
-                          BL_TO_FORTRAN_ANYD(crse[mfi]),
-                          BL_TO_FORTRAN_ANYD(ffab),
-                          &nc);
+            const Box& bx = mfi.growntilebox(ng); // only grow to outer directions of tileboxes for filling guards
+
+            amrex::ParallelFor(
+                bx,
+                InterpolateDensityFineToCoarse(fine.const_array(mfi), coarse.array(mfi), refinement_ratio, nc)
+            );
         }
     }
 }
@@ -713,7 +714,7 @@ WarpX::RestrictRhoFromFineToCoarsePatch (int lev)
     if (rho_fp[lev]) {
         rho_cp[lev]->setVal(0.0);
         const IntVect& refinement_ratio = refRatio(lev-1);
-        SyncRho(*rho_fp[lev], *rho_cp[lev], refinement_ratio[0]);
+        interpolateDensityFineToCoarse(*rho_fp[lev], *rho_cp[lev], refinement_ratio[0]);
     }
 }
author	Weiqun Zhang <weiqunzhang@lbl.gov>	2019-10-11 19:53:11 -0700
committer	Weiqun Zhang <weiqunzhang@lbl.gov>	2019-10-11 19:53:11 -0700
commit	ded6dd2cb05a76e1df9ab8561148f00d5e0bd365 (patch)
tree	dc813a3ba2cc5eafb925cbf31498fadd0b26a275 /Source/Parallelization/WarpXComm.cpp
parent	358a8aa9fc550709e0f24a202f06a696be31ae93 (diff)
parent	d0b0c0940205a71534b96c4649aeffd983c4f9cf (diff)
download	WarpX-ded6dd2cb05a76e1df9ab8561148f00d5e0bd365.tar.gz WarpX-ded6dd2cb05a76e1df9ab8561148f00d5e0bd365.tar.zst WarpX-ded6dd2cb05a76e1df9ab8561148f00d5e0bd365.zip