Task 16605192

Name	hadcm3n_8ck0_1980_40_008725691_2
Workunit	8871669
Created	30 Apr 2014, 15:49:58 UTC
Sent	30 Apr 2014, 17:23:10 UTC
Report deadline	31 Jul 2014, 0:50:21 UTC
Received	2 Aug 2014, 10:47:45 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1319436
Run time	7 days 6 hours 1 min 13 sec
CPU time	6 days 16 hours 0 min 18 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	3.63 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> Le périphérique ne reconnaît pas la commande. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6340, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:56:58 (3736): No heartbeat from core client for 30 sec - exiting 09:56:59 (3736): No heartbeat from core client for 30 sec - exiting 09:57:00 (3736): No heartbeat from core client for 30 sec - exiting 09:57:01 (3736): No heartbeat from core client for 30 sec - exiting 09:57:02 (3736): No heartbeat from core client for 30 sec - exiting 09:57:03 (3736): No heartbeat from core client for 30 sec - exiting 09:57:04 (3736): No heartbeat from core client for 30 sec - exiting 09:57:05 (3736): No heartbeat from core client for 30 sec - exiting 09:57:06 (3736): No heartbeat from core client for 30 sec - exiting 09:57:07 (3736): No heartbeat from core client for 30 sec - exiting 09:57:08 (3736): No heartbeat from core client for 30 sec - exiting 09:57:09 (3736): No heartbeat from core client for 30 sec - exiting 09:57:10 (3736): No heartbeat from core client for 30 sec - exiting 09:57:11 (3736): No heartbeat from core client for 30 sec - exiting 09:57:12 (3736): No heartbeat from core client for 30 sec - exiting 09:57:13 (3736): No heartbeat from core client for 30 sec - exiting 09:57:14 (3736): No heartbeat from core client for 30 sec - exiting 09:57:15 (3736): No heartbeat from core client for 30 sec - exiting 09:57:16 (3736): No heartbeat from core client for 30 sec - exiting 09:57:17 (3736): No heartbeat from core client for 30 sec - exiting 09:57:18 (3736): No heartbeat from core client for 30 sec - exiting 09:57:19 (3736): No heartbeat from core client for 30 sec - exiting 09:57:20 (3736): No heartbeat from core client for 30 sec - exiting 09:57:21 (3736): No heartbeat from core client for 30 sec - exiting 09:57:22 (3736): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6304, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Aug 2014 20:19:22	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	492,480	574,739	1.1670
30 Jul 2014 08:25:30	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	466,560	546,228	1.1708
26 Jul 2014 07:21:08	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	440,640	516,878	1.1730
19 Jul 2014 15:58:24	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	414,720	487,624	1.1758
19 Jul 2014 07:35:46	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	388,800	458,416	1.1791
01 Jul 2014 11:31:56	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	362,880	429,051	1.1823
27 Jun 2014 19:56:21	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	336,960	399,635	1.1860
27 Jun 2014 11:33:46	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	311,040	370,460	1.1910
26 Jun 2014 09:54:34	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	285,120	341,495	1.1977
24 Jun 2014 10:42:42	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	259,200	310,645	1.1985
23 Jun 2014 12:30:34	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	233,280	282,488	1.2109
10 May 2014 04:42:29	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	207,360	251,225	1.2115
09 May 2014 07:15:58	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	181,440	220,586	1.2158
07 May 2014 11:34:21	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	155,520	189,437	1.2181
06 May 2014 14:26:24	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	129,600	157,751	1.2172
06 May 2014 04:15:25	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	103,680	125,724	1.2126
05 May 2014 07:53:36	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	77,760	94,243	1.2120
03 May 2014 13:54:22	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	51,840	62,470	1.2051
01 May 2014 14:14:38	1319436	16605192	hadcm3n_8ck0_1980_40_008725691_2	25,920	31,117	1.2005