hdiff output

r29574/sff2.c 2015-12-05 19:30:09.241067087 +0000 r29573/sff2.c 2015-12-05 19:30:09.437069714 +0000
 46:                int *, int *, int *, int *, int *); 46:                int *, int *, int *, int *, int *);
 47:  47: 
 48: void pdgemr2d_(INT_T *, INT_T *, 48: void pdgemr2d_(INT_T *, INT_T *,
 49:                REAL_T *, INT_T *, INT_T *, INT_T *,  49:                REAL_T *, INT_T *, INT_T *, INT_T *, 
 50:                REAL_T *, INT_T *, INT_T *, INT_T *, 50:                REAL_T *, INT_T *, INT_T *, INT_T *,
 51:                INT_T *); 51:                INT_T *);
 52:  52: 
 53: void pdgemm_(char *, char *, INT_T *, INT_T *, INT_T *, REAL_T *, 53: void pdgemm_(char *, char *, INT_T *, INT_T *, INT_T *, REAL_T *,
 54:              REAL_T *, INT_T *, INT_T *, INT_T *, 54:              REAL_T *, INT_T *, INT_T *, INT_T *,
 55:              REAL_T *, INT_T *, INT_T *, INT_T *, REAL_T *, 55:              REAL_T *, INT_T *, INT_T *, INT_T *, REAL_T *,
 56:              REAL_T *, INT_T *, INT_T *, INT_T *, INT_T, INT_T); 56:              REAL_T *, INT_T *, INT_T *, INT_T *);
 57:  57: 
 58: void dgemm_( char *, char *, INT_T *, INT_T*, INT_T*, REAL_T *, REAL_T *, 58: void dgemm_( char *, char *, INT_T *, INT_T*, INT_T*, REAL_T *, REAL_T *,
 59:              INT_T *, REAL_T *, INT_T *, REAL_T *, REAL_T*, INT_T *, INT_T, INT_T ); 59:              INT_T *, REAL_T *, INT_T *, REAL_T *, REAL_T*, INT_T * );
 60:  60: 
 61: /*********************************************************************** 61: /***********************************************************************
 62:                              GET() 62:                              GET()
 63: ************************************************************************/ 63: ************************************************************************/
 64:  64: 
 65: static char *get(size_t size) 65: static char *get(size_t size)
 66: { 66: {
 67:   char *ptr; 67:   char *ptr;
 68:  68: 
 69:   if (size == 0) { 69:   if (size == 0) {
6074:    * it would not be called from all processes, specifically not from6074:    * it would not be called from all processes, specifically not from
6075:    * the process that is on the 1x1 grid and has nprow == npcol == 1.6075:    * the process that is on the 1x1 grid and has nprow == npcol == 1.
6076:    */6076:    */
6077: 6077: 
6078:  if (gridim == 1) {6078:  if (gridim == 1) {
6079:     if (context_PxQ >= 0) {6079:     if (context_PxQ >= 0) {
6080: 6080: 
6081:       transa = 'T';6081:       transa = 'T';
6082:       transb = 'N';6082:       transb = 'N';
6083:       dgemm_(&transa, &transb, &n, &m3, &n, &dblone,6083:       dgemm_(&transa, &transb, &n, &m3, &n, &dblone,
6084:              sumdeijdn, &n, dreff, &n, &dblone, sumdeijdg, &n, 1, 1);6084:              sumdeijdn, &n, dreff, &n, &dblone, sumdeijdg, &n);
6085: 6085: 
6086:       t2 = seconds();6086:       t2 = seconds();
6087:       if (gb2_debug) {6087:       if (gb2_debug) {
6088:         printf("dgemm1 time = %10.2f\n\n", t2 - t1);6088:         printf("dgemm1 time = %10.2f\n\n", t2 - t1);
6089:         fflush(stdout);6089:         fflush(stdout);
6090:       }6090:       }
6091:       tb2g1 += t2 - t1;6091:       tb2g1 += t2 - t1;
6092:       t1 = t2;6092:       t1 = t2;
6093: 6093: 
6094:       transa = 'T';6094:       transa = 'T';
6095:       transb = 'N';6095:       transb = 'N';
6096:       dgemm_(&transa, &transb, &m3, &m3, &n, &dblone,6096:       dgemm_(&transa, &transb, &m3, &m3, &n, &dblone,
6097:              dreff, &n, sumdeijdg, &n, &dblone, g, &m3, 1, 1);6097:              dreff, &n, sumdeijdg, &n, &dblone, g, &m3);
6098: 6098: 
6099:       t2 = seconds();6099:       t2 = seconds();
6100:       if (gb2_debug) {6100:       if (gb2_debug) {
6101:         printf("dgemm2 time = %10.2f\n\n", t2 - t1);6101:         printf("dgemm2 time = %10.2f\n\n", t2 - t1);
6102:         fflush(stdout);6102:         fflush(stdout);
6103:       }6103:       }
6104:       tb2g2 += t2 - t1;6104:       tb2g2 += t2 - t1;
6105:       t1 = t2;6105:       t1 = t2;
6106: 6106: 
6107:       dgemm_(&transa, &transb, &m3, &m3, &n, &dblone,6107:       dgemm_(&transa, &transb, &m3, &m3, &n, &dblone,
6108:              sumdeijdh, &n, dreff, &n, &dblone, g, &m3, 1, 1);6108:              sumdeijdh, &n, dreff, &n, &dblone, g, &m3);
6109: 6109: 
6110:       t2 = seconds();6110:       t2 = seconds();
6111:       if (gb2_debug) {6111:       if (gb2_debug) {
6112:         printf("dgemm3 time = %10.2f\n\n", t2 -t1);6112:         printf("dgemm3 time = %10.2f\n\n", t2 -t1);
6113:         fflush(stdout);6113:         fflush(stdout);
6114:       }6114:       }
6115:       tb2g3 += t2 - t1;6115:       tb2g3 += t2 - t1;
6116:     }6116:     }
6117:   } else {6117:   } else {
6118:     if (context_PxQ >= 0) {6118:     if (context_PxQ >= 0) {
6119:       transa = 'N';6119:       transa = 'N';
6120:       transb = 'N';6120:       transb = 'N';
6121:       pdgemm_(&transa, &transb, &n, &m3, &n, &dblone,6121:       pdgemm_(&transa, &transb, &n, &m3, &n, &dblone,
6122:               sumdeijdn, &one, &one, desc_NxN,6122:               sumdeijdn, &one, &one, desc_NxN,
6123:               dreff, &one, &one, desc_Nx3N, &dblone,6123:               dreff, &one, &one, desc_Nx3N, &dblone,
6124:               sumdeijdg, &one, &one, desc_Nx3N, 1, 1);6124:               sumdeijdg, &one, &one, desc_Nx3N);
6125: 6125: 
6126:       t2 = seconds();6126:       t2 = seconds();
6127:       if (gb2_debug) {6127:       if (gb2_debug) {
6128:         printf("pdgemm1 time = %10.2f\n\n", t2 - t1);6128:         printf("pdgemm1 time = %10.2f\n\n", t2 - t1);
6129:         fflush(stdout);6129:         fflush(stdout);
6130:       }6130:       }
6131:       tb2g1 += t2 - t1;6131:       tb2g1 += t2 - t1;
6132:       t1 = t2;6132:       t1 = t2;
6133: 6133: 
6134:       transa = 'T';6134:       transa = 'T';
6135:       transb = 'N';6135:       transb = 'N';
6136:       pdgemm_(&transa, &transb, &m3, &m3, &n, &dblone,6136:       pdgemm_(&transa, &transb, &m3, &m3, &n, &dblone,
6137:               dreff, &one, &one, desc_Nx3N,6137:               dreff, &one, &one, desc_Nx3N,
6138:               sumdeijdg, &one, &one, desc_Nx3N, &dblone,6138:               sumdeijdg, &one, &one, desc_Nx3N, &dblone,
6139:               g, &one, &one, desc_3Nx3N, 1, 1);6139:               g, &one, &one, desc_3Nx3N);
6140: 6140: 
6141:       t2 = seconds();6141:       t2 = seconds();
6142:       if (gb2_debug) {6142:       if (gb2_debug) {
6143:         printf("pdgemm2 time = %10.2f\n\n", t2 - t1);6143:         printf("pdgemm2 time = %10.2f\n\n", t2 - t1);
6144:         fflush(stdout);6144:         fflush(stdout);
6145:       }6145:       }
6146:       tb2g2 += t2 - t1;6146:       tb2g2 += t2 - t1;
6147:       t1 = t2;6147:       t1 = t2;
6148: 6148: 
6149:       transa = 'T';6149:       transa = 'T';
6150:       transb = 'N';6150:       transb = 'N';
6151:       pdgemm_(&transa, &transb, &m3, &m3, &n, &dblone,6151:       pdgemm_(&transa, &transb, &m3, &m3, &n, &dblone,
6152:               sumdeijdh, &one, &one, desc_Nx3N,6152:               sumdeijdh, &one, &one, desc_Nx3N,
6153:               dreff, &one, &one, desc_Nx3N, &dblone,6153:               dreff, &one, &one, desc_Nx3N, &dblone,
6154:               g, &one, &one, desc_3Nx3N, 1, 1);6154:               g, &one, &one, desc_3Nx3N);
6155: 6155: 
6156:       t2 = seconds();6156:       t2 = seconds();
6157:       if (gb2_debug) {6157:       if (gb2_debug) {
6158:         printf("pdgemm3 time = %10.2f\n\n", t2 -t1);6158:         printf("pdgemm3 time = %10.2f\n\n", t2 -t1);
6159:         fflush(stdout);6159:         fflush(stdout);
6160:       }6160:       }
6161:       tb2g3 += t2 - t1;6161:       tb2g3 += t2 - t1;
6162:     }6162:     }
6163:   }6163:   }
6164: 6164: 
6197:    *6197:    *
6198:    * Next perform the outer multiplication for equations 5, 6, 9, 10,6198:    * Next perform the outer multiplication for equations 5, 6, 9, 10,
6199:    * 11 and 12.6199:    * 11 and 12.
6200:    *6200:    *
6201:    * Finally, perform the outer multiplication for equations 7 and 8.6201:    * Finally, perform the outer multiplication for equations 7 and 8.
6202:    */6202:    */
6203: 6203: 
6204:   transa = 'N';6204:   transa = 'N';
6205:   transb = 'N';6205:   transb = 'N';
6206:   dgemm_(&transa, &transb, &m3, &n, &n, &dblone,6206:   dgemm_(&transa, &transb, &m3, &n, &n, &dblone,
6207:          dreff, &m3, sumdeijdn, &n, &dblone, sumdeijdg, &m3, 1, 1);6207:          dreff, &m3, sumdeijdn, &n, &dblone, sumdeijdg, &m3);
6208: 6208: 
6209:   t2 = seconds();6209:   t2 = seconds();
6210:   if (gb2_debug) {6210:   if (gb2_debug) {
6211:     printf("dgemm1 time = %10.2f\n\n", t2 - t1);6211:     printf("dgemm1 time = %10.2f\n\n", t2 - t1);
6212:     fflush(stdout);6212:     fflush(stdout);
6213:   }6213:   }
6214:   tb2g1 += t2 - t1;6214:   tb2g1 += t2 - t1;
6215:   t1 = t2;6215:   t1 = t2;
6216: 6216: 
6217:   transa = 'N';6217:   transa = 'N';
6218:   transb = 'T';6218:   transb = 'T';
6219:   dgemm_(&transa, &transb, &m3, &m3, &n, &dblone,6219:   dgemm_(&transa, &transb, &m3, &m3, &n, &dblone,
6220:          sumdeijdg, &m3, dreff, &m3, &dblone, g, &m3, 1, 1);6220:          sumdeijdg, &m3, dreff, &m3, &dblone, g, &m3);
6221: 6221: 
6222:   t2 = seconds();6222:   t2 = seconds();
6223:   if (gb2_debug) {6223:   if (gb2_debug) {
6224:     printf("dgemm2 time = %10.2f\n\n", t2 - t1);6224:     printf("dgemm2 time = %10.2f\n\n", t2 - t1);
6225:     fflush(stdout);6225:     fflush(stdout);
6226:   }6226:   }
6227:   tb2g2 += t2 - t1;6227:   tb2g2 += t2 - t1;
6228:   t1 = t2;6228:   t1 = t2;
6229: 6229: 
6230:   transa = 'N';6230:   transa = 'N';
6231:   transb = 'T';6231:   transb = 'T';
6232:   dgemm_(&transa, &transb, &m3, &m3, &n, &dblone,6232:   dgemm_(&transa, &transb, &m3, &m3, &n, &dblone,
6233:          dreff, &m3, sumdeijdh, &m3, &dblone, g, &m3, 1, 1);6233:          dreff, &m3, sumdeijdh, &m3, &dblone, g, &m3);
6234: 6234: 
6235:   t2 = seconds();6235:   t2 = seconds();
6236:   if (gb2_debug) {6236:   if (gb2_debug) {
6237:     printf("dgemm3 time = %10.2f\n\n", t2 -t1);6237:     printf("dgemm3 time = %10.2f\n\n", t2 -t1);
6238:     fflush(stdout);6238:     fflush(stdout);
6239:   }6239:   }
6240:   tb2g3 += t2 - t1;6240:   tb2g3 += t2 - t1;
6241: 6241: 
6242: #endif6242: #endif
6243: 6243: 


legend
Lines Added 
Lines changed
 Lines Removed

hdiff - version: 2.1.0