tinker9/settle_8h_source.html

#pragma once

#include "ff/precision.h"

#include "seq/seq.h"

#include <tinker/detail/units.hh>


namespace tinker {

#pragma acc routine seq

template <class HTYPE>

SEQ_CUDA

void dk_settle1(time_prec dt, int iw, const pos_prec* restrict xold,

   const pos_prec* restrict yold, const pos_prec* restrict zold,

   pos_prec* restrict xnew, pos_prec* restrict ynew, pos_prec* restrict znew,

   vel_prec* restrict vx, vel_prec* restrict vy, vel_prec* restrict vz,

   const double* restrict mass, const int (*restrict iratwt)[3],

   const pos_prec (*restrict kratwt)[3])

{

   // atoms a, b, c; lengths ab, ac, bc

   int ia, ib, ic;

   double lab, lac, lbc;

   double m0, m1, m2, invm;

   ia = iratwt[iw][0];

   ib = iratwt[iw][1];

   ic = iratwt[iw][2];

   lab = kratwt[iw][0];

   lac = kratwt[iw][1];

   lbc = kratwt[iw][2];

   m0 = mass[ia];

   m1 = mass[ib];

   m2 = mass[ic];

   invm = 1 / (m0 + m1 + m2);


   // ABC0 is the triangle at t0.

   // ABC1 is the triangle at t0+dt in the absence of constraints.


   // global frame vectors AB0 and AC0

   double xb0, yb0, zb0, xc0, yc0, zc0;

   xb0 = xold[ib] - xold[ia];

   yb0 = yold[ib] - yold[ia];

   zb0 = zold[ib] - zold[ia];

   xc0 = xold[ic] - xold[ia];

   yc0 = yold[ic] - yold[ia];

   zc0 = zold[ic] - zold[ia];


   // global frame centroid D1

   double xcom, ycom, zcom;

   xcom = (m0 * xnew[ia] + m1 * xnew[ib] + m2 * xnew[ic]) * invm;

   ycom = (m0 * ynew[ia] + m1 * ynew[ib] + m2 * ynew[ic]) * invm;

   zcom = (m0 * znew[ia] + m1 * znew[ib] + m2 * znew[ic]) * invm;


   // global frame vectors DA1, DB1, DC1

   double xa1, ya1, za1, xb1, yb1, zb1, xc1, yc1, zc1;

   xa1 = xnew[ia] - xcom;

   ya1 = ynew[ia] - ycom;

   za1 = znew[ia] - zcom;

   xb1 = xnew[ib] - xcom;

   yb1 = ynew[ib] - ycom;

   zb1 = znew[ib] - zcom;

   xc1 = xnew[ic] - xcom;

   yc1 = ynew[ic] - ycom;

   zc1 = znew[ic] - zcom;


   // local frame unit vectors x', y', z' and rotation matrix

   double xakszd, yakszd, zakszd;

   double xaksxd, yaksxd, zaksxd;

   double xaksyd, yaksyd, zaksyd;

   double axlng, aylng, azlng;

   double trns11, trns21, trns31;

   double trns12, trns22, trns32;

   double trns13, trns23, trns33;

   // z' = AB0 cross AC0

   xakszd = yb0 * zc0 - zb0 * yc0;

   yakszd = zb0 * xc0 - xb0 * zc0;

   zakszd = xb0 * yc0 - yb0 * xc0;

   // x' = DA1 cross z'

   xaksxd = ya1 * zakszd - za1 * yakszd;

   yaksxd = za1 * xakszd - xa1 * zakszd;

   zaksxd = xa1 * yakszd - ya1 * xakszd;

   // y' = z' cross x'

   xaksyd = yakszd * zaksxd - zakszd * yaksxd;

   yaksyd = zakszd * xaksxd - xakszd * zaksxd;

   zaksyd = xakszd * yaksxd - yakszd * xaksxd;

   // normalize x', y', z' to get rotation matrix

   axlng = 1 / sqrt(xaksxd * xaksxd + yaksxd * yaksxd + zaksxd * zaksxd);

   aylng = 1 / sqrt(xaksyd * xaksyd + yaksyd * yaksyd + zaksyd * zaksyd);

   azlng = 1 / sqrt(xakszd * xakszd + yakszd * yakszd + zakszd * zakszd);

   trns11 = xaksxd * axlng;

   trns21 = yaksxd * axlng;

   trns31 = zaksxd * axlng;

   trns12 = xaksyd * aylng;

   trns22 = yaksyd * aylng;

   trns32 = zaksyd * aylng;

   trns13 = xakszd * azlng;

   trns23 = yakszd * azlng;

   trns33 = zakszd * azlng;


   // local frame vectors AB0 and AC0

   double xb0d, yb0d;

   double xc0d, yc0d;

   xb0d = trns11 * xb0 + trns21 * yb0 + trns31 * zb0;

   yb0d = trns12 * xb0 + trns22 * yb0 + trns32 * zb0;

   xc0d = trns11 * xc0 + trns21 * yc0 + trns31 * zc0;

   yc0d = trns12 * xc0 + trns22 * yc0 + trns32 * zc0;


   // local frame vectors DA1, DB1, DC1

   // double xa1d, ya1d;

   double za1d;

   double xb1d, yb1d, zb1d;

   double xc1d, yc1d, zc1d;

   // xa1d = trns11 * xa1 + trns21 * ya1 + trns31 * za1;

   // ya1d = trns12 * xa1 + trns22 * ya1 + trns32 * za1;

   za1d = trns13 * xa1 + trns23 * ya1 + trns33 * za1;

   xb1d = trns11 * xb1 + trns21 * yb1 + trns31 * zb1;

   yb1d = trns12 * xb1 + trns22 * yb1 + trns32 * zb1;

   zb1d = trns13 * xb1 + trns23 * yb1 + trns33 * zb1;

   xc1d = trns11 * xc1 + trns21 * yc1 + trns31 * zc1;

   yc1d = trns12 * xc1 + trns22 * yc1 + trns32 * zc1;

   zc1d = trns13 * xc1 + trns23 * yc1 + trns33 * zc1;


   //====================================================================//

   // analogous to Eq.A1 for arbitrary triangular constraint

   // local frame coordinates of abc0'

   // a0' = (0,yra,0); b0' = (xrb,yrb,0); c0' = (xrc,yrc,0)

   // In Eq.A1, ra, rb, and rc are lengths.

   // Here we use the SIGNED coordinates.

   double yra, xrb, yrb, xrc, yrc;

   {

      // first let A = (0,0), B = (lab,0), C = lac(cosA,sinA)

      // centroid G = (xg,yg)

      double cosA, sinA, xg, yg;

      cosA = (lab * lab + lac * lac - lbc * lbc) / (2 * lab * lac);

      sinA = sqrt(1 - cosA * cosA);

      xg = (m1 * lab + m2 * lac * cosA) * invm;

      yg = m2 * lac * sinA * invm;


      // vectors GA, GB, GC

      double xga, yga, xgb, ygb, xgc, ygc;

      double lga, lgb, lgc;

      double cosAGB, cosAGC, sinAGB, sinAGC;

      xga = -xg;

      yga = -yg;

      xgb = lab - xg;

      ygb = -yg;

      xgc = lac * cosA - xg;

      ygc = lac * sinA - yg;

      lga = sqrt(xga * xga + yga * yga);

      lgb = sqrt(xgb * xgb + ygb * ygb);

      lgc = sqrt(xgc * xgc + ygc * ygc);

      cosAGB = (xga * xgb + yga * ygb) / (lga * lgb);

      cosAGC = (xga * xgc + yga * ygc) / (lga * lgc);

      sinAGB = sqrt(1 - cosAGB * cosAGB);

      sinAGC = sqrt(1 - cosAGC * cosAGC);


      yra = lga;

      xrb = -sinAGB * lgb;

      yrb = cosAGB * lgb;

      xrc = sinAGC * lgc;

      yrc = cosAGC * lgc;

   }


   //====================================================================//

   // Eq.A5

   double sinphi, cosphi, sinpsi, cospsi;

   sinphi = za1d / yra;

   cosphi = sqrt(1 - sinphi * sinphi);

   sinpsi = ((zb1d - zc1d) - (yrb - yrc) * sinphi) / ((xrc - xrb) * cosphi);

   cospsi = sqrt(1 - sinpsi * sinpsi);


   //====================================================================//

   // Eq.A3 local frame vectors da2', db2', dc2'

   double ya2d;

   double xb2d, yb2d;

   double xc2d, yc2d;

   ya2d = yra * cosphi;

   xb2d = xrb * cospsi;

   yb2d = yrb * cosphi + xrb * sinphi * sinpsi;

   xc2d = xrc * cospsi;

   yc2d = yrc * cosphi + xrc * sinphi * sinpsi;

   // adjust numerical error for xb2' and xc2'

   // deltx**2 + ybc**2 + zbc**2 = lbc**2, where ybc**2 + zbc**2 = hh2

   double deltx, hh2;

   hh2 = (yc2d - yb2d) * (yc2d - yb2d) + (zc1d - zb1d) * (zc1d - zb1d);

   // adjusted xbc

   deltx = sqrt(lbc * lbc - hh2);

   // adjustment deltx - (xc - xb)

   deltx = deltx - xc2d + xb2d;

   // m0 xa(=0) + m1 xb + m2 xc = 0

   xb2d -= deltx * m2 / (m1 + m2);

   xc2d += deltx * m1 / (m1 + m2);


   //====================================================================//

   // Eq.A15

   double alpa, beta, gama, al2be2, sinthe, costhe;

   alpa = m1 * (yb2d * yb0d + xb2d * xb0d);

   alpa += m2 * (yc2d * yc0d + xc2d * xc0d);

   beta = m1 * (yb2d * xb0d - xb2d * yb0d);

   beta += m2 * (yc2d * xc0d - xc2d * yc0d);

   gama = m1 * (yb1d * xb0d - xb1d * yb0d);

   gama += m2 * (yc1d * xc0d - xc1d * yc0d);

   al2be2 = alpa * alpa + beta * beta;

   sinthe = (alpa * gama - beta * sqrt(al2be2 - gama * gama)) / al2be2;

   costhe = sqrt(1 - sinthe * sinthe);


   //====================================================================//

   // Eq.A4 local frame vectors da3', db3', dc3'

   double xa3d, ya3d, za3d;

   double xb3d, yb3d, zb3d;

   double xc3d, yc3d, zc3d;

   xa3d = -ya2d * sinthe;

   ya3d = ya2d * costhe;

   za3d = za1d;

   xb3d = xb2d * costhe - yb2d * sinthe;

   yb3d = xb2d * sinthe + yb2d * costhe;

   zb3d = zb1d;

   xc3d = xc2d * costhe - yc2d * sinthe;

   yc3d = xc2d * sinthe + yc2d * costhe;

   zc3d = zc1d;


   // global frame coordinates DA3, DB3, DC3

   double xa3, ya3, za3;

   double xb3, yb3, zb3;

   double xc3, yc3, zc3;

   xa3 = trns11 * xa3d + trns12 * ya3d + trns13 * za3d;

   ya3 = trns21 * xa3d + trns22 * ya3d + trns23 * za3d;

   za3 = trns31 * xa3d + trns32 * ya3d + trns33 * za3d;

   xb3 = trns11 * xb3d + trns12 * yb3d + trns13 * zb3d;

   yb3 = trns21 * xb3d + trns22 * yb3d + trns23 * zb3d;

   zb3 = trns31 * xb3d + trns32 * yb3d + trns33 * zb3d;

   xc3 = trns11 * xc3d + trns12 * yc3d + trns13 * zc3d;

   yc3 = trns21 * xc3d + trns22 * yc3d + trns23 * zc3d;

   zc3 = trns31 * xc3d + trns32 * yc3d + trns33 * zc3d;


   xnew[ia] = xcom + xa3;

   ynew[ia] = ycom + ya3;

   znew[ia] = zcom + za3;

   xnew[ib] = xcom + xb3;

   ynew[ib] = ycom + yb3;

   znew[ib] = zcom + zb3;

   xnew[ic] = xcom + xc3;

   ynew[ic] = ycom + yc3;

   znew[ic] = zcom + zc3;


   //====================================================================//

   // velocity correction due to the position constraints


   // This code is not in the original SETTLE paper, but is necessary for

   // the velocity verlet integrator.

   if CONSTEXPR (not eq<HTYPE, SHAKE>()) {

      double invdt = 1 / dt;

      vx[ia] += (xa3 - xa1) * invdt;

      vy[ia] += (ya3 - ya1) * invdt;

      vz[ia] += (za3 - za1) * invdt;

      vx[ib] += (xb3 - xb1) * invdt;

      vy[ib] += (yb3 - yb1) * invdt;

      vz[ib] += (zb3 - zb1) * invdt;

      vx[ic] += (xc3 - xc1) * invdt;

      vy[ic] += (yc3 - yc1) * invdt;

      vz[ic] += (zc3 - zc1) * invdt;

   }

}


#pragma acc routine seq

template <bool DO_V>

SEQ_CUDA

void dk_settle2(time_prec dt, int iw, vel_prec* restrict vx,

   vel_prec* restrict vy, vel_prec* restrict vz, const pos_prec* restrict xpos,

   const pos_prec* restrict ypos, const pos_prec* restrict zpos,

   const double* restrict mass, const int (*restrict iratwt)[3],

   double& restrict vxx, double& restrict vyx, double& restrict vzx,

   double& restrict vyy, double& restrict vzy, double& restrict vzz)

{

   int ia, ib, ic;

   double m0, m1, m2;

   ia = iratwt[iw][0];

   ib = iratwt[iw][1];

   ic = iratwt[iw][2];

   m0 = mass[ia];

   m1 = mass[ib];

   m2 = mass[ic];


   // vectors AB, BC, CA

   double xab, yab, zab;

   double xbc, ybc, zbc;

   double xca, yca, zca;

   xab = xpos[ib] - xpos[ia];

   yab = ypos[ib] - ypos[ia];

   zab = zpos[ib] - zpos[ia];

   xbc = xpos[ic] - xpos[ib];

   ybc = ypos[ic] - ypos[ib];

   zbc = zpos[ic] - zpos[ib];

   xca = xpos[ia] - xpos[ic];

   yca = ypos[ia] - ypos[ic];

   zca = zpos[ia] - zpos[ic];


   // unit vectors eAB, eBC, eCA

   double ablng, bclng, calng;

   double xeab, yeab, zeab;

   double xebc, yebc, zebc;

   double xeca, yeca, zeca;

   ablng = 1 / sqrt(xab * xab + yab * yab + zab * zab);

   bclng = 1 / sqrt(xbc * xbc + ybc * ybc + zbc * zbc);

   calng = 1 / sqrt(xca * xca + yca * yca + zca * zca);

   xeab = xab * ablng;

   yeab = yab * ablng;

   zeab = zab * ablng;

   xebc = xbc * bclng;

   yebc = ybc * bclng;

   zebc = zbc * bclng;

   xeca = xca * calng;

   yeca = yca * calng;

   zeca = zca * calng;


   // velocity vectors vAB, vBC, vCA

   double xvab, yvab, zvab;

   double xvbc, yvbc, zvbc;

   double xvca, yvca, zvca;

   xvab = vx[ib] - vx[ia];

   yvab = vy[ib] - vy[ia];

   zvab = vz[ib] - vz[ia];

   xvbc = vx[ic] - vx[ib];

   yvbc = vy[ic] - vy[ib];

   zvbc = vz[ic] - vz[ib];

   xvca = vx[ia] - vx[ic];

   yvca = vy[ia] - vy[ic];

   zvca = vz[ia] - vz[ic];


   double vabab, vbcbc, vcaca;

   vabab = xvab * xeab + yvab * yeab + zvab * zeab;

   vbcbc = xvbc * xebc + yvbc * yebc + zvbc * zebc;

   vcaca = xvca * xeca + yvca * yeca + zvca * zeca;


   double cosa, cosb, cosc;

   cosa = -xeab * xeca - yeab * yeca - zeab * zeca;

   cosb = -xebc * xeab - yebc * yeab - zebc * zeab;

   cosc = -xeca * xebc - yeca * yebc - zeca * zebc;


   //====================================================================//

   // Eq.B1

   // M (tab,tbc,tca) = m2v, where

   // m2v = (ma mb vab0, mb mc vbc0, mc ma vca0),

   //     (a1,a2,a3)

   // M = (b1,b2,b3)

   //     (c1,c2,c3)

   double a1, a2, a3, b1, b2, b3, c1, c2, c3, denom;

   a1 = m0 + m1;

   a2 = m0 * cosb;

   a3 = m1 * cosa;

   b1 = m2 * cosb;

   b2 = m1 + m2;

   b3 = m1 * cosc;

   c1 = m2 * cosa;

   c2 = m0 * cosc;

   c3 = m2 + m0;

   // det(M)

   denom = a1 * (b2 * c3 - b3 * c2) + a2 * (b3 * c1 - b1 * c3)

      + a3 * (b1 * c2 - b2 * c1);


   // inverse(M)*det(M)

   double av1, av2, av3, bv1, bv2, bv3, cv1, cv2, cv3;

   av1 = b2 * c3 - b3 * c2;

   av2 = c2 * a3 - c3 * a2;

   av3 = a2 * b3 - a3 * b2;

   bv1 = b3 * c1 - b1 * c3;

   bv2 = c3 * a1 - c1 * a3;

   bv3 = a3 * b1 - a1 * b3;

   cv1 = b1 * c2 - b2 * c1;

   cv2 = c1 * a2 - c2 * a1;

   cv3 = a1 * b2 - a2 * b1;


   // t = inverse(M)*m2v

   double tabd, tbcd, tcad;

   tabd = av1 * m0 * m1 * vabab + av2 * m1 * m2 * vbcbc + av3 * m2 * m0 * vcaca;

   tbcd = bv1 * m0 * m1 * vabab + bv2 * m1 * m2 * vbcbc + bv3 * m2 * m0 * vcaca;

   tcad = cv1 * m0 * m1 * vabab + cv2 * m1 * m2 * vbcbc + cv3 * m2 * m0 * vcaca;


   denom = 1 / denom;

   vx[ia] += (xeab * tabd - xeca * tcad) / m0 * denom;

   vz[ia] += (zeab * tabd - zeca * tcad) / m0 * denom;

   vy[ia] += (yeab * tabd - yeca * tcad) / m0 * denom;

   vx[ib] += (xebc * tbcd - xeab * tabd) / m1 * denom;

   vy[ib] += (yebc * tbcd - yeab * tabd) / m1 * denom;

   vz[ib] += (zebc * tbcd - zeab * tabd) / m1 * denom;

   vx[ic] += (xeca * tcad - xebc * tbcd) / m2 * denom;

   vy[ic] += (yeca * tcad - yebc * tbcd) / m2 * denom;

   vz[ic] += (zeca * tcad - zebc * tbcd) / m2 * denom;


   if CONSTEXPR (DO_V) {

      const double vterm = 2 / (dt * units::ekcal);

      double xterm, yterm, zterm;

      vxx = 0, vyx = 0, vzx = 0, vyy = 0, vzy = 0, vzz = 0;

      xterm = xeab * tabd * denom * vterm;

      yterm = yeab * tabd * denom * vterm;

      zterm = zeab * tabd * denom * vterm;

      vxx += xab * xterm;

      vyx += yab * xterm;

      vzx += zab * xterm;

      vyy += yab * yterm;

      vzy += zab * yterm;

      vzz += zab * zterm;

      xterm = xebc * tbcd * denom * vterm;

      yterm = yebc * tbcd * denom * vterm;

      zterm = zebc * tbcd * denom * vterm;

      vxx += xbc * xterm;

      vyx += ybc * xterm;

      vzx += zbc * xterm;

      vyy += ybc * yterm;

      vzy += zbc * yterm;

      vzz += zbc * zterm;

      xterm = xeca * tcad * denom * vterm;

      yterm = yeca * tcad * denom * vterm;

      zterm = zeca * tcad * denom * vterm;

      vxx += xca * xterm;

      vyx += yca * xterm;

      vzx += zca * xterm;

      vyy += yca * yterm;

      vzy += zca * yterm;

      vzz += zca * zterm;

   }

}

}

SEQ_CUDA
#define SEQ_CUDA
Definition: acc/seqdef.h:12

restrict
#define restrict
Definition: macro.h:51

CONSTEXPR
#define CONSTEXPR
Definition: macro.h:61

tinker::mass
double * mass
Atomic mass.

tinker::ypos
pos_prec * ypos
Definition: atom.h:62

tinker::zpos
pos_prec * zpos
Definition: atom.h:62

tinker::xpos
pos_prec * xpos

tinker::iratwt
int(* iratwt)[3]

tinker::kratwt
pos_prec(* kratwt)[3]

tinker::vy
vel_prec * vy
Velocities.
Definition: pq.h:76

tinker::vx
vel_prec * vx
Velocities.

tinker::vz
vel_prec * vz
Velocities.
Definition: pq.h:76

tinker::pos_prec
mixed pos_prec
Floating-point type for coordinates.
Definition: precision.h:93

tinker::time_prec
mixed time_prec
Floating-point type for time.
Definition: precision.h:90

tinker::vel_prec
mixed vel_prec
Floating-point type for velocities.
Definition: precision.h:92

tinker
Definition: testrt.h:9

tinker::dk_settle2
__device__ void dk_settle2(time_prec dt, int iw, vel_prec *__restrict__ vx, vel_prec *__restrict__ vy, vel_prec *__restrict__ vz, const pos_prec *__restrict__ xpos, const pos_prec *__restrict__ ypos, const pos_prec *__restrict__ zpos, const double *__restrict__ mass, const int(*__restrict__ iratwt)[3], double &__restrict__ vxx, double &__restrict__ vyx, double &__restrict__ vzx, double &__restrict__ vyy, double &__restrict__ vzy, double &__restrict__ vzz)
Definition: settle.h:264

tinker::dk_settle1
__device__ void dk_settle1(time_prec dt, int iw, const pos_prec *__restrict__ xold, const pos_prec *__restrict__ yold, const pos_prec *__restrict__ zold, pos_prec *__restrict__ xnew, pos_prec *__restrict__ ynew, pos_prec *__restrict__ znew, vel_prec *__restrict__ vx, vel_prec *__restrict__ vy, vel_prec *__restrict__ vz, const double *__restrict__ mass, const int(*__restrict__ iratwt)[3], const pos_prec(*__restrict__ kratwt)[3])
Definition: settle.h:10