Task 12496111

Name	famous_wqnz_2099_200_007121494_0
Workunit	7319854
Created	16 Jan 2011, 16:25:32 UTC
Sent	17 Jan 2011, 17:39:21 UTC
Report deadline	19 Apr 2011, 1:06:32 UTC
Received	10 Mar 2011, 4:37:01 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1090105
Run time	3 days 18 hours 34 min 44 sec
CPU time	3 days 16 hours 11 min 2 sec
Validate state	Invalid
Credit	2,192.68
Device peak FLOPS	3.40 GFLOPS
Application version	UK Met Office FAMOUS v6.11 windows_intelx86
Stderr	<core_client_version>6.12.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:21:42 (7704): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:21:43 (7704): No heartbeat from core client for 30 sec - exiting 23:09:40 (3568): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:10:48 (9764): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:20:19 (924): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:21:14 (3520): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:23:12 (7104): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:08:07 (9828): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:08:48 (8664): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 03:12:42 (8536): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 03:12:43 (8536): No heartbeat from core client for 30 sec - exiting 04:19:27 (8824): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:19:28 (8824): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 04:31:30 (5880): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 06:17:57 (5064): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:19:11 (6396): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8504, iMonCtr=1 Model crash detected, will try to restart... 06:58:05 (1156): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:56:42 (5120): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 15:38:32 (6536): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:09:58 (8120): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:34:33 (2412): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10052, iMonCtr=1 Model crash detected, will try to restart... BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 CPDN Monitor - Quit request from BOINC... 01:36:59 (8832): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:38:49 (7256): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10156, iMonCtr=1 Model crash detected, will try to restart... 00:26:51 (6764): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:56:24 (6756): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 17:42:13 (1732): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:42:14 (1732): No heartbeat from core client for 30 sec - exiting 17:42:15 (1732): No heartbeat from core client for 30 sec - exiting 22:42:58 (4980): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:44:23 (7432): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6224, iMonCtr=1 Model crash detected, will try to restart... 23:27:09 (3000): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy Sorry, too many model crashes! :-( 06:01:06 (4252): called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 Mar 2011 03:21:12	1090105	12496111	famous_wqnz_2099_200_007121494_0	664,586	315,157	0.4742
10 Mar 2011 01:36:11	1090105	12496111	famous_wqnz_2099_200_007121494_0	655,226	309,164	0.4718
09 Mar 2011 23:50:28	1090105	12496111	famous_wqnz_2099_200_007121494_0	645,866	303,001	0.4691
09 Mar 2011 21:54:44	1090105	12496111	famous_wqnz_2099_200_007121494_0	636,506	296,703	0.4661
08 Mar 2011 17:05:29	1090105	12496111	famous_wqnz_2099_200_007121494_0	627,146	290,636	0.4634
08 Mar 2011 17:05:29	1090105	12496111	famous_wqnz_2099_200_007121494_0	617,786	284,609	0.4607
08 Mar 2011 17:05:29	1090105	12496111	famous_wqnz_2099_200_007121494_0	608,426	278,493	0.4577
08 Mar 2011 17:05:29	1090105	12496111	famous_wqnz_2099_200_007121494_0	599,066	272,414	0.4547
08 Mar 2011 17:05:29	1090105	12496111	famous_wqnz_2099_200_007121494_0	589,706	266,329	0.4516
24 Feb 2011 02:10:04	1090105	12496111	famous_wqnz_2099_200_007121494_0	580,346	261,797	0.4511
24 Feb 2011 01:03:49	1090105	12496111	famous_wqnz_2099_200_007121494_0	570,986	257,788	0.4515
23 Feb 2011 23:57:19	1090105	12496111	famous_wqnz_2099_200_007121494_0	561,626	253,839	0.4520
23 Feb 2011 22:48:18	1090105	12496111	famous_wqnz_2099_200_007121494_0	552,266	249,810	0.4523
16 Feb 2011 10:17:32	1090105	12496111	famous_wqnz_2099_200_007121494_0	542,906	245,751	0.4527
16 Feb 2011 09:56:24	1090105	12496111	famous_wqnz_2099_200_007121494_0	533,546	240,583	0.4509
16 Feb 2011 09:56:24	1090105	12496111	famous_wqnz_2099_200_007121494_0	524,186	234,638	0.4476
16 Feb 2011 09:56:24	1090105	12496111	famous_wqnz_2099_200_007121494_0	514,826	228,695	0.4442
16 Feb 2011 09:56:24	1090105	12496111	famous_wqnz_2099_200_007121494_0	505,466	222,736	0.4407
13 Feb 2011 00:30:39	1090105	12496111	famous_wqnz_2099_200_007121494_0	496,106	216,799	0.4370
12 Feb 2011 23:14:03	1090105	12496111	famous_wqnz_2099_200_007121494_0	486,746	212,734	0.4371