Task 13371139

Name	hadcm3n_t0a2_1940_40_007452264_1
Workunit	7649767
Created	10 Sep 2011, 12:57:41 UTC
Sent	11 Sep 2011, 10:32:52 UTC
Report deadline	11 Dec 2011, 18:00:03 UTC
Received	18 Sep 2011, 22:33:15 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1024632
Run time	6 days 20 hours 44 min 32 sec
CPU time	3 days 17 hours 29 min 5 sec
Validate state	Invalid
Credit	2,799.36
Device peak FLOPS	2.24 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... 08:55:15 (1880): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:51:01 (4120): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:51:03 (4120): No heartbeat from core client for 30 sec - exiting 14:51:04 (4120): No heartbeat from core client for 30 sec - exiting 14:51:05 (4120): No heartbeat from core client for 30 sec - exiting 14:51:06 (4120): No heartbeat from core client for 30 sec - exiting 14:51:07 (4120): No heartbeat from core client for 30 sec - exiting 14:51:08 (4120): No heartbeat from core client for 30 sec - exiting 14:51:09 (4120): No heartbeat from core client for 30 sec - exiting 14:51:13 (4120): No heartbeat from core client for 30 sec - exiting 14:51:14 (4120): No heartbeat from core client for 30 sec - exiting 14:51:15 (4120): No heartbeat from core client for 30 sec - exiting 14:51:16 (4120): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:49:48 (2348): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 14:29:09 (4564): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 forrtl: There is not enough space on the disk. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2448, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipBUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Sep 2011 19:11:40	1024632	13371139	hadcm3n_t0a2_1940_40_007452264_1	233,280	504,072	2.1608
18 Sep 2011 02:41:15	1024632	13371139	hadcm3n_t0a2_1940_40_007452264_1	207,360	446,542	2.1535
17 Sep 2011 09:40:42	1024632	13371139	hadcm3n_t0a2_1940_40_007452264_1	181,440	387,275	2.1345
16 Sep 2011 16:44:31	1024632	13371139	hadcm3n_t0a2_1940_40_007452264_1	155,520	327,030	2.1028
15 Sep 2011 03:42:48	1024632	13371139	hadcm3n_t0a2_1940_40_007452264_1	129,600	302,327	2.3328
14 Sep 2011 10:06:15	1024632	13371139	hadcm3n_t0a2_1940_40_007452264_1	103,680	240,818	2.3227
13 Sep 2011 17:14:37	1024632	13371139	hadcm3n_t0a2_1940_40_007452264_1	77,760	180,408	2.3201
12 Sep 2011 21:15:53	1024632	13371139	hadcm3n_t0a2_1940_40_007452264_1	51,840	120,295	2.3205
12 Sep 2011 04:55:38	1024632	13371139	hadcm3n_t0a2_1940_40_007452264_1	25,920	60,734	2.3431