LU-6261 gnilnd: Use trylock for conn mutex.

author Chris Horn <hornc@cray.com>

Mon, 29 Jun 2015 18:50:24 +0000 (13:50 -0500)

committer Oleg Drokin <oleg.drokin@intel.com>

Sat, 25 Jul 2015 03:07:56 +0000 (03:07 +0000)
author Chris Horn <hornc@cray.com>
Mon, 29 Jun 2015 18:50:24 +0000 (13:50 -0500)
committer Oleg Drokin <oleg.drokin@intel.com>
Sat, 25 Jul 2015 03:07:56 +0000 (03:07 +0000)
diff --git a/lnet/klnds/gnilnd/gnilnd.c b/lnet/klnds/gnilnd/gnilnd.c

index 7e67339..d29749e 100644 (file)
--- a/lnet/klnds/gnilnd/gnilnd.c
+++ b/lnet/klnds/gnilnd/gnilnd.c
@@ -248,7 +248,8 @@ kgnilnd_create_conn(kgn_conn_t **connp, kgn_device_t *dev)
                 return -ENOMEM;
         }
  
                 return -ENOMEM;
         }
  
-       LIBCFS_ALLOC(conn->gnc_tx_ref_table, GNILND_MAX_MSG_ID * sizeof(void *));
+       conn->gnc_tx_ref_table =
+               kgnilnd_vmalloc(GNILND_MAX_MSG_ID * sizeof(void *));
         if (conn->gnc_tx_ref_table == NULL) {
                 CERROR("Can't allocate conn tx_ref_table\n");
                 GOTO(failed, rc = -ENOMEM);
         if (conn->gnc_tx_ref_table == NULL) {
                 CERROR("Can't allocate conn tx_ref_table\n");
                 GOTO(failed, rc = -ENOMEM);
@@ -1789,7 +1790,8 @@ kgnilnd_report_node_state(lnet_nid_t nid, int down)
                  */
                 kgnilnd_txlist_done(&zombies, -ENETRESET);
                 kgnilnd_peer_notify(peer, -ECONNRESET, 0);
                  */
                 kgnilnd_txlist_done(&zombies, -ENETRESET);
                 kgnilnd_peer_notify(peer, -ECONNRESET, 0);
-               LCONSOLE_INFO("Recieved down event for nid %lld\n", nid);
+               LCONSOLE_INFO("Received down event for nid %d\n",
+                             LNET_NIDADDR(nid));
         }
  
         return 0;
         }
  
         return 0;
diff --git a/lnet/klnds/gnilnd/gnilnd.h b/lnet/klnds/gnilnd/gnilnd.h

index a878522..2b9c039 100644 (file)
--- a/lnet/klnds/gnilnd/gnilnd.h
+++ b/lnet/klnds/gnilnd/gnilnd.h
@@ -484,6 +484,7 @@ typedef struct kgn_tunables {
         int     *kgn_efault_lbug;      /* LBUG on receiving an EFAULT */
         int     *kgn_max_purgatory;    /* # conns/peer to keep in purgatory */
         int     *kgn_thread_affinity;  /* bind scheduler threads to cpus */
         int     *kgn_efault_lbug;      /* LBUG on receiving an EFAULT */
         int     *kgn_max_purgatory;    /* # conns/peer to keep in purgatory */
         int     *kgn_thread_affinity;  /* bind scheduler threads to cpus */
+       int     *kgn_thread_safe;      /* use thread safe kgni API */
  #if CONFIG_SYSCTL && !CFS_SYSFS_MODULE_PARM
         cfs_sysctl_table_header_t *kgn_sysctl;  /* sysctl interface */
  #endif
  #if CONFIG_SYSCTL && !CFS_SYSFS_MODULE_PARM
         cfs_sysctl_table_header_t *kgn_sysctl;  /* sysctl interface */
  #endif
@@ -893,14 +894,6 @@ kgnilnd_thread_fini(void)
         atomic_dec(&kgnilnd_data.kgn_nthreads);
  }
  
         atomic_dec(&kgnilnd_data.kgn_nthreads);
  }
  
-static inline int kgnilnd_gl_mutex_trylock(struct mutex *lock)
-{
-       if (kgnilnd_data.kgn_enable_gl_mutex)
-               return mutex_trylock(lock);
-       else
-               return 1;
-}
-
  static inline void kgnilnd_gl_mutex_lock(struct mutex *lock)
  {
         if (kgnilnd_data.kgn_enable_gl_mutex)
  static inline void kgnilnd_gl_mutex_lock(struct mutex *lock)
  {
         if (kgnilnd_data.kgn_enable_gl_mutex)
@@ -938,14 +931,11 @@ static inline void kgnilnd_conn_mutex_unlock(struct mutex *lock)
   * This function must not be used in interrupt context. The
   * mutex must be released by the same task that acquired it.
   */
   * This function must not be used in interrupt context. The
   * mutex must be released by the same task that acquired it.
   */
-static inline int kgnilnd_mutex_trylock(struct mutex *lock)
+static inline int __kgnilnd_mutex_trylock(struct mutex *lock)
  {
         int             ret;
         unsigned long   timeout;
  
  {
         int             ret;
         unsigned long   timeout;
  
-       if (!kgnilnd_data.kgn_enable_gl_mutex)
-               return 1;
-
         LASSERT(!in_interrupt());
  
         for (timeout = jiffies + 1; time_before(jiffies, timeout);) {
         LASSERT(!in_interrupt());
  
         for (timeout = jiffies + 1; time_before(jiffies, timeout);) {
@@ -957,6 +947,30 @@ static inline int kgnilnd_mutex_trylock(struct mutex *lock)
         return 0;
  }
  
         return 0;
  }
  
+static inline int kgnilnd_mutex_trylock(struct mutex *lock)
+{
+       if (!kgnilnd_data.kgn_enable_gl_mutex)
+               return 1;
+
+       return __kgnilnd_mutex_trylock(lock);
+}
+
+static inline int kgnilnd_trylock(struct mutex *cq_lock,
+                                 struct mutex *c_lock)
+{
+       if (kgnilnd_data.kgn_enable_gl_mutex)
+               return __kgnilnd_mutex_trylock(cq_lock);
+       else
+               return __kgnilnd_mutex_trylock(c_lock);
+}
+
+static inline void *kgnilnd_vmalloc(int size)
+{
+       void *ret = __vmalloc(size, __GFP_HIGHMEM | GFP_NOFS, PAGE_KERNEL);
+       LIBCFS_ALLOC_POST(ret, size);
+       return ret;
+}
+
  /* Copied from DEBUG_REQ in Lustre - the dance is needed to save stack space */
  
  extern void
  /* Copied from DEBUG_REQ in Lustre - the dance is needed to save stack space */
  
  extern void
diff --git a/lnet/klnds/gnilnd/gnilnd_api_wrap.h b/lnet/klnds/gnilnd/gnilnd_api_wrap.h

index 7f2a5e3..a22c665 100644 (file)
--- a/lnet/klnds/gnilnd/gnilnd_api_wrap.h
+++ b/lnet/klnds/gnilnd/gnilnd_api_wrap.h
@@ -128,6 +128,11 @@ kgnilnd_check_kgni_version(void)
         }
  
         symbol_put(kgni_driver_version);
         }
  
         symbol_put(kgni_driver_version);
+
+       if (!*kgnilnd_tunables.kgn_thread_safe) {
+               return;
+       }
+
         /* Use thread-safe locking */
         kgnilnd_data.kgn_enable_gl_mutex = 0;
  }
         /* Use thread-safe locking */
         kgnilnd_data.kgn_enable_gl_mutex = 0;
  }
diff --git a/lnet/klnds/gnilnd/gnilnd_aries.h b/lnet/klnds/gnilnd/gnilnd_aries.h

index ce187ed..50ef0b8 100644 (file)
--- a/lnet/klnds/gnilnd/gnilnd_aries.h
+++ b/lnet/klnds/gnilnd/gnilnd_aries.h
@@ -56,6 +56,7 @@
  
  /* Thread-safe kgni implemented in minor ver 45, code rev 0xb9 */
  #define GNILND_KGNI_TS_MINOR_VER 0x45
  
  /* Thread-safe kgni implemented in minor ver 45, code rev 0xb9 */
  #define GNILND_KGNI_TS_MINOR_VER 0x45
+#define GNILND_TS_ENABLE         1
  
  /* plug in our functions for use on the simulator */
  #if !defined(GNILND_USE_RCA)
  
  /* plug in our functions for use on the simulator */
  #if !defined(GNILND_USE_RCA)
diff --git a/lnet/klnds/gnilnd/gnilnd_cb.c b/lnet/klnds/gnilnd/gnilnd_cb.c

index 7175f0d..de84a5b 100644 (file)
--- a/lnet/klnds/gnilnd/gnilnd_cb.c
+++ b/lnet/klnds/gnilnd/gnilnd_cb.c
@@ -1471,7 +1471,6 @@ kgnilnd_sendmsg_nolock(kgn_tx_t *tx, void *immediate, unsigned int immediatenob,
          */
         msg->gnm_connstamp = conn->gnc_my_connstamp;
         msg->gnm_payload_len = immediatenob;
          */
         msg->gnm_connstamp = conn->gnc_my_connstamp;
         msg->gnm_payload_len = immediatenob;
-       kgnilnd_conn_mutex_lock(&conn->gnc_smsg_mutex);
         msg->gnm_seq = atomic_read(&conn->gnc_tx_seq);
  
         /* always init here - kgn_checksum is a /sys module tunable
         msg->gnm_seq = atomic_read(&conn->gnc_tx_seq);
  
         /* always init here - kgn_checksum is a /sys module tunable
@@ -1586,6 +1585,7 @@ kgnilnd_sendmsg(kgn_tx_t *tx, void *immediate, unsigned int immediatenob,
  
         timestamp = jiffies;
         kgnilnd_gl_mutex_lock(&dev->gnd_cq_mutex);
  
         timestamp = jiffies;
         kgnilnd_gl_mutex_lock(&dev->gnd_cq_mutex);
+       kgnilnd_conn_mutex_lock(&tx->tx_conn->gnc_smsg_mutex);
         /* delay in jiffies - we are really concerned only with things that
          * result in a schedule() or really holding this off for long times .
          * NB - mutex_lock could spin for 2 jiffies before going to sleep to wait */
         /* delay in jiffies - we are really concerned only with things that
          * result in a schedule() or really holding this off for long times .
          * NB - mutex_lock could spin for 2 jiffies before going to sleep to wait */
@@ -1630,7 +1630,8 @@ kgnilnd_sendmsg_trylock(kgn_tx_t *tx, void *immediate, unsigned int immediatenob
                 rc = 0;
         } else {
                 atomic_inc(&conn->gnc_device->gnd_fast_try);
                 rc = 0;
         } else {
                 atomic_inc(&conn->gnc_device->gnd_fast_try);
-               rc = kgnilnd_gl_mutex_trylock(&conn->gnc_device->gnd_cq_mutex);
+               rc = kgnilnd_trylock(&conn->gnc_device->gnd_cq_mutex,
+                                    &conn->gnc_smsg_mutex);
         }
         if (!rc) {
                 rc = -EAGAIN;
         }
         if (!rc) {
                 rc = -EAGAIN;
diff --git a/lnet/klnds/gnilnd/gnilnd_gemini.h b/lnet/klnds/gnilnd/gnilnd_gemini.h

index 1e7e2f6..d405bcf 100644 (file)
--- a/lnet/klnds/gnilnd/gnilnd_gemini.h
+++ b/lnet/klnds/gnilnd/gnilnd_gemini.h
@@ -40,5 +40,6 @@
  
  /* Thread-safe kgni implemented in minor ver 44, code rev 0xb9 */
  #define GNILND_KGNI_TS_MINOR_VER 0x44
  
  /* Thread-safe kgni implemented in minor ver 44, code rev 0xb9 */
  #define GNILND_KGNI_TS_MINOR_VER 0x44
+#define GNILND_TS_ENABLE         0
  
  #endif /* _GNILND_GEMINI_H */
  
  #endif /* _GNILND_GEMINI_H */
diff --git a/lnet/klnds/gnilnd/gnilnd_modparams.c b/lnet/klnds/gnilnd/gnilnd_modparams.c

index d89dc3e..26814aa 100644 (file)
--- a/lnet/klnds/gnilnd/gnilnd_modparams.c
+++ b/lnet/klnds/gnilnd/gnilnd_modparams.c
@@ -192,7 +192,11 @@ CFS_MODULE_PARM(max_conn_purg, "i", int, 0644,
  
  static int thread_affinity = 0;
  CFS_MODULE_PARM(thread_affinity, "i", int, 0444,
  
  static int thread_affinity = 0;
  CFS_MODULE_PARM(thread_affinity, "i", int, 0444,
-               "scheduler thread affinity default 0 (diabled)");
+               "scheduler thread affinity default 0 (disabled)");
+
+static int thread_safe = GNILND_TS_ENABLE;
+CFS_MODULE_PARM(thread_safe, "i", int, 0444,
+               "Use kgni thread safe API if available");
  
  kgn_tunables_t kgnilnd_tunables = {
         .kgn_min_reconnect_interval = &min_reconnect_interval,
  
  kgn_tunables_t kgnilnd_tunables = {
         .kgn_min_reconnect_interval = &min_reconnect_interval,
@@ -233,6 +237,7 @@ kgn_tunables_t kgnilnd_tunables = {
         .kgn_fast_reconn            = &fast_reconn,
         .kgn_efault_lbug            = &efault_lbug,
         .kgn_thread_affinity        = &thread_affinity,
         .kgn_fast_reconn            = &fast_reconn,
         .kgn_efault_lbug            = &efault_lbug,
         .kgn_thread_affinity        = &thread_affinity,
+       .kgn_thread_safe            = &thread_safe,
         .kgn_max_purgatory          = &max_conn_purg
  };
  
         .kgn_max_purgatory          = &max_conn_purg
  };
  
@@ -535,6 +540,14 @@ static struct ctl_table kgnilnd_ctl_table[] = {
         },
         {
                 INIT_CTL_NAME
         },
         {
                 INIT_CTL_NAME
+               .procname = "thread_safe"
+               .data     = &thread_safe,
+               .maxlen   = sizeof(int),
+               .mode     = 0444,
+               .proc_handler = &proc_dointvec
+       },
+       {
+               INIT_CTL_NAME
                 .procname = "max_conn_purg"
                 .data     = &max_conn_purg,
                 .maxlen   = sizeof(int),
                 .procname = "max_conn_purg"
                 .data     = &max_conn_purg,
                 .maxlen   = sizeof(int),
author	Chris Horn <hornc@cray.com>
	Mon, 29 Jun 2015 18:50:24 +0000 (13:50 -0500)
committer	Oleg Drokin <oleg.drokin@intel.com>
	Sat, 25 Jul 2015 03:07:56 +0000 (03:07 +0000)
lnet/klnds/gnilnd/gnilnd.c		patch \| blob \| history
lnet/klnds/gnilnd/gnilnd.h		patch \| blob \| history
lnet/klnds/gnilnd/gnilnd_api_wrap.h		patch \| blob \| history
lnet/klnds/gnilnd/gnilnd_aries.h		patch \| blob \| history
lnet/klnds/gnilnd/gnilnd_cb.c		patch \| blob \| history
lnet/klnds/gnilnd/gnilnd_gemini.h		patch \| blob \| history
lnet/klnds/gnilnd/gnilnd_modparams.c		patch \| blob \| history