Task 13268751

Name	hadcm3n_yakq_1940_40_007413309_1
Workunit	7610939
Created	17 Aug 2011, 6:37:31 UTC
Sent	18 Aug 2011, 6:21:24 UTC
Report deadline	17 Nov 2011, 13:48:35 UTC
Received	21 Aug 2011, 21:15:25 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1164253
Run time	3 days 4 hours 0 min 34 sec
CPU time	3 days 3 hours 36 min 7 sec
Validate state	Invalid
Credit	3,421.44
Device peak FLOPS	4.19 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3496, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3496, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3496, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3496, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2624, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3268, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
21 Aug 2011 09:29:11	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	285,120	250,206	0.8775
21 Aug 2011 02:56:07	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	259,200	226,838	0.8751
20 Aug 2011 21:03:47	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	233,280	203,743	0.8734
20 Aug 2011 13:50:17	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	207,360	180,828	0.8720
20 Aug 2011 07:11:30	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	181,440	157,730	0.8693
19 Aug 2011 23:52:01	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	155,520	134,642	0.8658
19 Aug 2011 18:02:18	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	129,600	113,720	0.8775
19 Aug 2011 12:11:21	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	103,680	92,548	0.8926
19 Aug 2011 05:39:35	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	77,760	69,488	0.8936
18 Aug 2011 23:14:16	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	51,840	46,461	0.8962
18 Aug 2011 16:44:41	1164253	13268751	hadcm3n_yakq_1940_40_007413309_1	25,920	23,372	0.9017