Fix saving of debug level for startup level 0
[tinc] / src / process.c
index 5d31b8d..4626d74 100644 (file)
@@ -1,7 +1,7 @@
 /*
     process.c -- process management functions
-    Copyright (C) 1999,2000 Ivo Timmermans <itimmermans@bigfoot.com>,
-                       2000 Guus Sliepen <guus@sliepen.warande.net>
+    Copyright (C) 1999-2002 Ivo Timmermans <ivo@o2w.nl>,
+                  2000-2002 Guus Sliepen <guus@sliepen.eu.org>
 
     This program is free software; you can redistribute it and/or modify
     it under the terms of the GNU General Public License as published by
@@ -17,7 +17,7 @@
     along with this program; if not, write to the Free Software
     Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
 
-    $Id: process.c,v 1.1.2.4 2000/11/17 10:03:02 guus Exp $
+    $Id: process.c,v 1.1.2.50 2002/09/30 19:04:37 zarq Exp $
 */
 
 #include "config.h"
 #include <syslog.h>
 #include <sys/ioctl.h>
 #include <sys/types.h>
+#include <sys/stat.h>
 #include <sys/wait.h>
+#include <stdlib.h>
 #include <unistd.h>
+#include <termios.h>
 
-#include <list.h>
 #include <pidfile.h>
 #include <utils.h>
 #include <xalloc.h>
 
 #include "conf.h"
 #include "process.h"
+#include "subnet.h"
+#include "device.h"
+#include "connection.h"
+#include "device.h"
 
 #include "system.h"
 
-/* A list containing all our children */
-list_t *child_pids;
-
 /* If zero, don't detach from the terminal. */
 int do_detach = 1;
 
-static pid_t ppid;
-
 extern char *identname;
 extern char *pidfilename;
 extern char **g_argv;
 
+sigset_t emptysigset;
+
+static int saved_debug_lvl = -1;
+
+extern int sighup;
+extern int sigalrm;
+extern int do_purge;
+
 void memory_full(int size)
 {
-  syslog(LOG_ERR, _("Memory exhausted (couldn't allocate %d bytes), exiting."), size);
-  cp_trace();
-  exit(1);
+       syslog(LOG_ERR, _("Memory exhausted (couldn't allocate %d bytes), exitting."), size);
+       cp_trace();
+       exit(1);
+}
+
+/* Some functions the less gifted operating systems might lack... */
+
+#ifndef HAVE_FCLOSEALL
+int fcloseall(void)
+{
+       fflush(stdin);
+       fflush(stdout);
+       fflush(stderr);
+       fclose(stdin);
+       fclose(stdout);
+       fclose(stderr);
+       return 0;
 }
+#endif
 
 /*
   Close network connections, and terminate neatly
 */
 void cleanup_and_exit(int c)
 {
-  close_network_connections();
+       cp();
+
+       close_network_connections();
+
+       if(debug_lvl > DEBUG_NOTHING)
+               dump_device_stats();
 
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_INFO, _("Total bytes written: tap %d, socket %d; bytes read: tap %d, socket %d"),
-          total_tap_out, total_socket_out, total_tap_in, total_socket_in);
+       syslog(LOG_NOTICE, _("Terminating"));
 
-  closelog();
-  kill(ppid, SIGTERM);
-  exit(c);
+       closelog();
+       exit(c);
 }
 
 /*
@@ -83,48 +109,63 @@ void cleanup_and_exit(int c)
 */
 int write_pidfile(void)
 {
-  int pid;
-
-  if((pid = check_pid(pidfilename)))
-    {
-      if(netname)
-       fprintf(stderr, _("A tincd is already running for net `%s' with pid %d.\n"),
-               netname, pid);
-      else
-       fprintf(stderr, _("A tincd is already running with pid %d.\n"), pid);
-      return 1;
-    }
-
-  /* if it's locked, write-protected, or whatever */
-  if(!write_pid(pidfilename))
-    return 1;
-
-  return 0;
+       int pid;
+
+       cp();
+
+       pid = check_pid(pidfilename);
+
+       if(pid) {
+               if(netname)
+                       fprintf(stderr, _("A tincd is already running for net `%s' with pid %d.\n"),
+                                       netname, pid);
+               else
+                       fprintf(stderr, _("A tincd is already running with pid %d.\n"), pid);
+               return 1;
+       }
+
+       /* if it's locked, write-protected, or whatever */
+       if(!write_pid(pidfilename))
+               return 1;
+
+       return 0;
 }
 
 /*
   kill older tincd for this net
 */
-int kill_other(void)
+int kill_other(int signal)
 {
-  int pid;
-
-  if(!(pid = read_pid(pidfilename)))
-    {
-      if(netname)
-       fprintf(stderr, _("No other tincd is running for net `%s'.\n"), netname);
-      else
-       fprintf(stderr, _("No other tincd is running.\n"));
-      return 1;
-    }
-
-  errno = 0;    /* No error, sometimes errno is only changed on error */
-  /* ESRCH is returned when no process with that pid is found */
-  if(kill(pid, SIGTERM) && errno == ESRCH)
-    fprintf(stderr, _("Removing stale lock file.\n"));
-  remove_pid(pidfilename);
-
-  return 0;
+       int pid;
+
+       cp();
+
+       pid = read_pid(pidfilename);
+
+       if(!pid) {
+               if(netname)
+                       fprintf(stderr, _("No other tincd is running for net `%s'.\n"),
+                                       netname);
+               else
+                       fprintf(stderr, _("No other tincd is running.\n"));
+               return 1;
+       }
+
+       errno = 0;                                      /* No error, sometimes errno is only changed on error */
+
+       /* ESRCH is returned when no process with that pid is found */
+       if(kill(pid, signal) && errno == ESRCH) {
+               if(netname)
+                       fprintf(stderr, _("The tincd for net `%s' is no longer running. "),
+                                       netname);
+               else
+                       fprintf(stderr, _("The tincd is no longer running. "));
+
+               fprintf(stderr, _("Removing stale lock file.\n"));
+               remove_pid(pidfilename);
+       }
+
+       return 0;
 }
 
 /*
@@ -132,167 +173,134 @@ int kill_other(void)
 */
 int detach(void)
 {
-  int fd;
-  pid_t pid;
+       cp();
 
-  setup_signals();
+       setup_signals();
 
-  if(write_pidfile())
-    return -1;
+       /* First check if we can open a fresh new pidfile */
 
-  if(do_detach)
-    daemon(0, 0);
+       if(write_pidfile())
+               return -1;
 
-  openlog(identname, LOG_CONS | LOG_PID, LOG_DAEMON);
+       /* If we succeeded in doing that, detach */
 
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("tincd %s (%s %s) starting, debug level %d"),
-          VERSION, __DATE__, __TIME__, debug_lvl);
-  else
-    syslog(LOG_NOTICE, _("tincd %s starting"), VERSION);
+       closelog();
 
-  xalloc_fail_func = memory_full;
+       if(do_detach) {
+               if(daemon(0, 0) < 0) {
+                       fprintf(stderr, _("Couldn't detach from terminal: %s"),
+                                       strerror(errno));
+                       return -1;
+               }
 
-  return 0;
+               /* Now UPDATE the pid in the pidfile, because we changed it... */
+
+               if(!write_pid(pidfilename))
+                       return -1;
+       }
+
+       openlog(identname, LOG_CONS | LOG_PID, LOG_DAEMON);
+
+       if(debug_lvl > DEBUG_NOTHING)
+               syslog(LOG_NOTICE, _("tincd %s (%s %s) starting, debug level %d"),
+                          VERSION, __DATE__, __TIME__, debug_lvl);
+       else
+               syslog(LOG_NOTICE, _("tincd %s starting"), VERSION);
+
+       xalloc_fail_func = memory_full;
+
+       return 0;
 }
 
 /*
   Execute the program name, with sane environment.  All output will be
   redirected to syslog.
 */
-void _execute_script(const char *name)  __attribute__ ((noreturn));
-void _execute_script(const char *name)
+void _execute_script(const char *scriptname, char **envp)
+       __attribute__ ((noreturn));
+void _execute_script(const char *scriptname, char **envp)
 {
-  int error = 0;
-  char *scriptname;
-  char *s;
-
-  if(netname)
-    {
-      asprintf(&s, "NETNAME=%s", netname);
-      putenv(s);       /* Don't free s! see man 3 putenv */
-    }
-#ifdef HAVE_UNSETENV
-  else
-    {
-      unsetenv("NETNAME");
-    }
-#endif
+       cp();
 
-  if(chdir(confbase) < 0)
-    /* This cannot fail since we already read config files from this
-       directory. - Guus */
-    /* Yes this can fail, somebody could have removed this directory
-       when we didn't pay attention. - Ivo */
-    {
-      if(chdir("/") < 0)
-       /* Now if THIS fails, something wicked is going on. - Ivo */
-       syslog(LOG_ERR, _("Couldn't chdir to `/': %m"));
-
-      /* Continue anyway. */
-    }
-  
-  asprintf(&scriptname, "%s/%s", confbase, name);
-
-  /* Close all file descriptors */
-  closelog();
-  fcloseall();
-
-  /* Open standard input */
-  if(open("/dev/null", O_RDONLY) < 0)
-    {
-      syslog(LOG_ERR, _("Opening `/dev/null' failed: %m"));
-      error = 1;
-    }
-
-  if(!error)
-    {
-      /* Standard output directly goes to syslog */
-      openlog(name, LOG_CONS | LOG_PID, LOG_DAEMON);
-      /* Standard error as well */
-      if(dup2(1, 2) < 0)
-       {
-         syslog(LOG_ERR, _("System call `%s' failed: %m"),
-                "dup2");
-         error = 1;
-       }
-    }
-  
-  if(error && debug_lvl > 1)
-    syslog(LOG_INFO, _("This means that any output the script generates will not be shown in syslog."));
-  
-  execl(scriptname, NULL);
-  /* No return on success */
-  
-  if(errno != ENOENT)  /* Ignore if the file does not exist */
-    syslog(LOG_WARNING, _("Error executing `%s': %m"), scriptname);
-
-  /* No need to free things */
-  exit(0);
+       while(*envp)
+               putenv(*envp++);
+
+       chdir("/");
+
+       /* Close all file descriptors */
+       closelog();                                     /* <- this means we cannot use syslog() here anymore! */
+       fcloseall();
+
+       execl(scriptname, NULL);
+       /* No return on success */
+
+       openlog("tinc", LOG_CONS | LOG_PID, LOG_DAEMON);
+       syslog(LOG_ERR, _("Could not execute `%s': %s"), scriptname,
+                  strerror(errno));
+       exit(errno);
 }
 
 /*
   Fork and execute the program pointed to by name.
 */
-int execute_script(const char *name)
+int execute_script(const char *name, char **envp)
 {
-  pid_t pid;
-
-  if((pid = fork()) < 0)
-    {
-      syslog(LOG_ERR, _("System call `%s' failed: %m"),
-            "fork");
-      return -1;
-    }
-
-  if(pid)
-    {
-      list_append(child_pids, (void*)(int)pid);
-      return 0;
-    }
-
-  /* Child here */
-  _execute_script(name);
-}
+       pid_t pid;
+       int status;
+       struct stat s;
+       char *scriptname;
 
-/*
-  Check a child (the pointer data is actually an integer, the PID of
-  that child.  A non-zero return value means that the child has exited
-  and can be removed from our list.
-*/
-int check_child(void *data)
-{
-  pid_t pid;
-  int status;
-
-  pid = (pid_t) data;
-  pid = waitpid(pid, &status, WNOHANG);
-  if(WIFEXITED(status))
-    {
-      if(WIFSIGNALED(status)) /* Child was killed by a signal */
-       {
-         syslog(LOG_ERR, _("Child with PID %d was killed by signal %d (%s)"),
-                pid, WTERMSIG(status), strsignal(WTERMSIG(status)));
-         return -1;
+       cp();
+
+       asprintf(&scriptname, "%s/%s", confbase, name);
+
+       /* First check if there is a script */
+
+       if(stat(scriptname, &s))
+               return 0;
+
+       pid = fork();
+
+       if(pid < 0) {
+               syslog(LOG_ERR, _("System call `%s' failed: %s"), "fork",
+                          strerror(errno));
+               return -1;
        }
-      if(WEXITSTATUS(status) != 0)
-       {
-         syslog(LOG_INFO, _("Child with PID %d exited with code %d"),
-                WEXITSTATUS(status));
+
+       if(pid) {
+               if(debug_lvl >= DEBUG_STATUS)
+                       syslog(LOG_INFO, _("Executing script %s"), name);
+
+               free(scriptname);
+
+               if(waitpid(pid, &status, 0) == pid) {
+                       if(WIFEXITED(status)) { /* Child exited by itself */
+                               if(WEXITSTATUS(status)) {
+                                       syslog(LOG_ERR, _("Process %d (%s) exited with non-zero status %d"),
+                                                  pid, name, WEXITSTATUS(status));
+                                       return -1;
+                               } else
+                                       return 0;
+                       } else if(WIFSIGNALED(status)) {        /* Child was killed by a signal */
+                               syslog(LOG_ERR, _("Process %d (%s) was killed by signal %d (%s)"), pid,
+                                          name, WTERMSIG(status), strsignal(WTERMSIG(status)));
+                               return -1;
+                       } else {                        /* Something strange happened */
+
+                               syslog(LOG_ERR, _("Process %d (%s) terminated abnormally"), pid,
+                                          name);
+                               return -1;
+                       }
+               } else {
+                       syslog(LOG_ERR, _("System call `%s' failed: %s"), "waitpid",
+                                  strerror(errno));
+                       return -1;
+               }
        }
-      return -1;
-    }
 
-  /* Child is still running */
-  return 0;
-}
+       /* Child here */
 
-/*
-  Check the status of all our children.
-*/
-void check_children(void)
-{
-  list_forall_nodes(child_pids, check_child);
+       _execute_script(scriptname, envp);
 }
 
 
@@ -300,112 +308,167 @@ void check_children(void)
   Signal handlers.
 */
 
-RETSIGTYPE
-sigterm_handler(int a)
+RETSIGTYPE sigterm_handler(int a)
 {
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("Got TERM signal"));
+       if(debug_lvl > DEBUG_NOTHING)
+               syslog(LOG_NOTICE, _("Got TERM signal"));
 
-  cleanup_and_exit(0);
+       cleanup_and_exit(0);
 }
 
-RETSIGTYPE
-sigquit_handler(int a)
+RETSIGTYPE sigquit_handler(int a)
 {
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("Got QUIT signal"));
-  cleanup_and_exit(0);
+       if(debug_lvl > DEBUG_NOTHING)
+               syslog(LOG_NOTICE, _("Got QUIT signal"));
+       cleanup_and_exit(0);
 }
 
-RETSIGTYPE
-sigsegv_square(int a)
+RETSIGTYPE fatal_signal_square(int a)
 {
-  syslog(LOG_ERR, _("Got another SEGV signal: not restarting"));
-  exit(0);
+       syslog(LOG_ERR, _("Got another fatal signal %d (%s): not restarting."), a,
+                  strsignal(a));
+       cp_trace();
+       exit(1);
 }
 
-RETSIGTYPE
-sigsegv_handler(int a)
+RETSIGTYPE fatal_signal_handler(int a)
 {
-  syslog(LOG_ERR, _("Got SEGV signal"));
-  cp_trace();
-
-  if(do_detach)
-    {
-      syslog(LOG_NOTICE, _("Trying to re-execute in 5 seconds..."));
-      signal(SIGSEGV, sigsegv_square);
-      close_network_connections();
-      sleep(5);
-      remove_pid(pidfilename);
-      execvp(g_argv[0], g_argv);
-    }
-  else
-    {
-      syslog(LOG_NOTICE, _("Not restarting."));
-      exit(0);
-    }
+       struct sigaction act;
+       syslog(LOG_ERR, _("Got fatal signal %d (%s)"), a, strsignal(a));
+       cp_trace();
+
+       if(do_detach) {
+               syslog(LOG_NOTICE, _("Trying to re-execute in 5 seconds..."));
+
+               act.sa_handler = fatal_signal_square;
+               act.sa_mask = emptysigset;
+               act.sa_flags = 0;
+               sigaction(SIGSEGV, &act, NULL);
+
+               close_network_connections();
+               sleep(5);
+               remove_pid(pidfilename);
+               execvp(g_argv[0], g_argv);
+       } else {
+               syslog(LOG_NOTICE, _("Not restarting."));
+               exit(1);
+       }
 }
 
-RETSIGTYPE
-sighup_handler(int a)
+RETSIGTYPE sighup_handler(int a)
 {
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("Got HUP signal"));
-  sighup = 1;
+       if(debug_lvl > DEBUG_NOTHING)
+               syslog(LOG_NOTICE, _("Got HUP signal"));
+       sighup = 1;
+}
+
+RETSIGTYPE sigint_handler(int a)
+{
+       if(saved_debug_lvl != -1) {
+               syslog(LOG_NOTICE, _("Reverting to old debug level (%d)"),
+                          saved_debug_lvl);
+               debug_lvl = saved_debug_lvl;
+               saved_debug_lvl = -1;
+       } else {
+               syslog(LOG_NOTICE, _("Temporarily setting debug level to 5.  Kill me with SIGINT again to go back to level %d."),
+                          debug_lvl);
+               saved_debug_lvl = debug_lvl;
+               debug_lvl = 5;
+       }
 }
 
-RETSIGTYPE
-sigint_handler(int a)
+RETSIGTYPE sigalrm_handler(int a)
 {
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("Got INT signal, exiting"));
-  cleanup_and_exit(0);
+       if(debug_lvl > DEBUG_NOTHING)
+               syslog(LOG_NOTICE, _("Got ALRM signal"));
+       sigalrm = 1;
 }
 
-RETSIGTYPE
-sigusr1_handler(int a)
+RETSIGTYPE sigusr1_handler(int a)
 {
-  dump_conn_list();
+       dump_connections();
 }
 
-RETSIGTYPE
-sigusr2_handler(int a)
+RETSIGTYPE sigusr2_handler(int a)
 {
-  dump_subnet_list();
+       dump_device_stats();
+       dump_nodes();
+       dump_edges();
+       dump_subnets();
 }
 
-RETSIGTYPE
-sighuh(int a)
+RETSIGTYPE sigwinch_handler(int a)
 {
-  syslog(LOG_WARNING, _("Got unexpected signal %d (%s)"), a, strsignal(a));
-  cp_trace();
+       extern int do_purge;
+       do_purge = 1;
 }
 
-void
-setup_signals(void)
+RETSIGTYPE unexpected_signal_handler(int a)
 {
-  int i;
-
-  for(i=0;i<32;i++)
-    signal(i,sighuh);
-
-  if(signal(SIGTERM, SIG_IGN) != SIG_ERR)
-    signal(SIGTERM, sigterm_handler);
-  if(signal(SIGQUIT, SIG_IGN) != SIG_ERR)
-    signal(SIGQUIT, sigquit_handler);
-  if(signal(SIGSEGV, SIG_IGN) != SIG_ERR)
-    signal(SIGSEGV, sigsegv_handler);
-  if(signal(SIGHUP, SIG_IGN) != SIG_ERR)
-    signal(SIGHUP, sighup_handler);
-  signal(SIGPIPE, SIG_IGN);
-  if(signal(SIGINT, SIG_IGN) != SIG_ERR)
-    signal(SIGINT, sigint_handler);
-  signal(SIGUSR1, sigusr1_handler);
-  signal(SIGUSR2, sigusr2_handler);
-  signal(SIGCHLD, SIG_IGN);
+       syslog(LOG_WARNING, _("Got unexpected signal %d (%s)"), a, strsignal(a));
+       cp_trace();
 }
 
-RETSIGTYPE parent_exit(int a)
+RETSIGTYPE ignore_signal_handler(int a)
 {
-  exit(0);
+       if(debug_lvl >= DEBUG_SCARY_THINGS) {
+               syslog(LOG_DEBUG, _("Ignored signal %d (%s)"), a, strsignal(a));
+               cp_trace();
+       }
+}
+
+struct {
+       int signal;
+       void (*handler)(int);
+} sighandlers[] = {
+       {
+       SIGHUP, sighup_handler}, {
+       SIGTERM, sigterm_handler}, {
+       SIGQUIT, sigquit_handler}, {
+       SIGSEGV, fatal_signal_handler}, {
+       SIGBUS, fatal_signal_handler}, {
+       SIGILL, fatal_signal_handler}, {
+       SIGPIPE, ignore_signal_handler}, {
+       SIGINT, sigint_handler}, {
+       SIGUSR1, sigusr1_handler}, {
+       SIGUSR2, sigusr2_handler}, {
+       SIGCHLD, ignore_signal_handler}, {
+       SIGALRM, sigalrm_handler}, {
+       SIGWINCH, sigwinch_handler}, {
+       0, NULL}
+};
+
+void setup_signals(void)
+{
+       int i;
+       struct sigaction act;
+
+       sigemptyset(&emptysigset);
+       act.sa_handler = NULL;
+       act.sa_mask = emptysigset;
+       act.sa_flags = 0;
+
+       /* Set a default signal handler for every signal, errors will be
+          ignored. */
+       for(i = 0; i < NSIG; i++) {
+               if(!do_detach)
+                       act.sa_handler = SIG_DFL;
+               else
+                       act.sa_handler = unexpected_signal_handler;
+               sigaction(i, &act, NULL);
+       }
+
+       /* If we didn't detach, allow coredumps */
+       if(!do_detach)
+               sighandlers[3].handler = SIG_DFL;
+
+       /* Then, for each known signal that we want to catch, assign a
+          handler to the signal, with error checking this time. */
+       for(i = 0; sighandlers[i].signal; i++) {
+               act.sa_handler = sighandlers[i].handler;
+               if(sigaction(sighandlers[i].signal, &act, NULL) < 0)
+                       fprintf(stderr, _("Installing signal handler for signal %d (%s) failed: %s\n"),
+                                       sighandlers[i].signal, strsignal(sighandlers[i].signal),
+                                       strerror(errno));
+       }
 }