Move fencing to after keepalive output

Just makes the messages a little easier to read when triggered.
2019-07-09 14:24:31 -04:00
parent 17dfaf43c5
commit 19701c66e4
1 changed files with 29 additions and 30 deletions
--- a/node-daemon/pvcd/Daemon.py
+++ b/node-daemon/pvcd/Daemon.py
@@ -1142,36 +1142,6 @@ def update_zookeeper():
        # Close the Libvirt connection
        lv_conn.close()

-    # Look for dead nodes and fence them
-    if debug:
-        print("Look for dead nodes and fence them")
-    if config['daemon_mode'] == 'coordinator':
-        for node_name in d_node:
-            try:
-                node_daemon_state = zkhandler.readdata(zk_conn, '/nodes/{}/daemonstate'.format(node_name))
-                node_domain_state = zkhandler.readdata(zk_conn, '/nodes/{}/domainstate'.format(node_name))
-                node_keepalive = int(zkhandler.readdata(zk_conn, '/nodes/{}/keepalive'.format(node_name)))
-            except:
-                node_daemon_state = 'unknown'
-                node_domain_state = 'unknown'
-                node_keepalive = 0
-
-            # Handle deadtime and fencng if needed
-            # (A node is considered dead when its keepalive timer is >6*keepalive_interval seconds
-            # out-of-date while in 'start' state)
-            node_deadtime = int(time.time()) - ( int(config['keepalive_interval']) * int(config['fence_intervals']) )
-            if node_keepalive < node_deadtime and node_daemon_state == 'run':
-                logger.out('Node {} seems dead - starting monitor for fencing'.format(node_name), state='w')
-                zk_lock = zkhandler.writelock(zk_conn, '/nodes/{}/daemonstate'.format(node_name))
-                with zk_lock:
-                    # Ensures that, if we lost the lock race and come out of waiting,
-                    # we won't try to trigger our own fence thread.
-                    if zkhandler.readdata(zk_conn, '/nodes/{}/daemonstate'.format(node_name)) != 'dead':
-                        fence_thread = threading.Thread(target=fencing.fenceNode, args=(node_name, zk_conn, config, logger), kwargs={})
-                        fence_thread.start()
-                    # Write the updated data after we start the fence thread
-                    zkhandler.writedata(zk_conn, { '/nodes/{}/daemonstate'.format(node_name): 'dead' })
-
    # Display node information to the terminal
    if config['log_keepalives']:
        logger.out(
@@ -1216,6 +1186,35 @@ def update_zookeeper():
                ),
            )

+    # Look for dead nodes and fence them
+    if debug:
+        print("Look for dead nodes and fence them")
+    if config['daemon_mode'] == 'coordinator':
+        for node_name in d_node:
+            try:
+                node_daemon_state = zkhandler.readdata(zk_conn, '/nodes/{}/daemonstate'.format(node_name))
+                node_domain_state = zkhandler.readdata(zk_conn, '/nodes/{}/domainstate'.format(node_name))
+                node_keepalive = int(zkhandler.readdata(zk_conn, '/nodes/{}/keepalive'.format(node_name)))
+            except:
+                node_daemon_state = 'unknown'
+                node_domain_state = 'unknown'
+                node_keepalive = 0
+
+            # Handle deadtime and fencng if needed
+            # (A node is considered dead when its keepalive timer is >6*keepalive_interval seconds
+            # out-of-date while in 'start' state)
+            node_deadtime = int(time.time()) - ( int(config['keepalive_interval']) * int(config['fence_intervals']) )
+            if node_keepalive < node_deadtime and node_daemon_state == 'run':
+                logger.out('Node {} seems dead - starting monitor for fencing'.format(node_name), state='w')
+                zk_lock = zkhandler.writelock(zk_conn, '/nodes/{}/daemonstate'.format(node_name))
+                with zk_lock:
+                    # Ensures that, if we lost the lock race and come out of waiting,
+                    # we won't try to trigger our own fence thread.
+                    if zkhandler.readdata(zk_conn, '/nodes/{}/daemonstate'.format(node_name)) != 'dead':
+                        fence_thread = threading.Thread(target=fencing.fenceNode, args=(node_name, zk_conn, config, logger), kwargs={})
+                        fence_thread.start()
+                    # Write the updated data after we start the fence thread
+                    zkhandler.writedata(zk_conn, { '/nodes/{}/daemonstate'.format(node_name): 'dead' })

 # Start keepalive thread
 update_timer = startKeepaliveTimer()