Whamcloud - gitweb
LU-5485 lnet: peer aliveness status and NI status
[fs/lustre-release.git] / lnet / include / lnet / lib-lnet.h
index 452a325..a48a5d3 100644 (file)
@@ -1,6 +1,4 @@
-/* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
- * vim:expandtab:shiftwidth=8:tabstop=8:
- *
+/*
  * GPL HEADER START
  *
  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
  * GPL HEADER END
  */
 /*
- * Copyright  2008 Sun Microsystems, Inc. All rights reserved
+ * Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
  * Use is subject to license terms.
+ *
+ * Copyright (c) 2012, 2013, Intel Corporation.
  */
 /*
  * This file is part of Lustre, http://www.lustre.org/
 #ifndef __LNET_LIB_LNET_H__
 #define __LNET_LIB_LNET_H__
 
-#if defined(__linux__)
 #include <lnet/linux/lib-lnet.h>
-#elif defined(__APPLE__)
-#include <lnet/darwin/lib-lnet.h>
-#elif defined(__WINNT__)
-#include <lnet/winnt/lib-lnet.h>
-#else
-#error Unsupported Operating System
-#endif
 
 #include <libcfs/libcfs.h>
 #include <lnet/types.h>
 #include <lnet/lnet.h>
 #include <lnet/lib-types.h>
+#include <lnet/lib-dlc.h>
 
 extern lnet_t  the_lnet;                        /* THE network */
 
+#if !defined(__KERNEL__) || defined(LNET_USE_LIB_FREELIST)
+/* 1 CPT, simplify implementation... */
+# define LNET_CPT_MAX_BITS      0
+
+#else /* KERNEL and no freelist */
+
+# if (BITS_PER_LONG == 32)
+/* 2 CPTs, allowing more CPTs might make us under memory pressure */
+#  define LNET_CPT_MAX_BITS     1
+
+# else /* 64-bit system */
+/*
+ * 256 CPTs for thousands of CPUs, allowing more CPTs might make us
+ * under risk of consuming all lh_cookie.
+ */
+#  define LNET_CPT_MAX_BITS     8
+# endif /* BITS_PER_LONG == 32 */
+#endif
+
+/* max allowed CPT number */
+#define LNET_CPT_MAX            (1 << LNET_CPT_MAX_BITS)
+
+#define LNET_CPT_NUMBER         (the_lnet.ln_cpt_number)
+#define LNET_CPT_BITS           (the_lnet.ln_cpt_bits)
+#define LNET_CPT_MASK           ((1ULL << LNET_CPT_BITS) - 1)
+
+/** exclusive lock */
+#define LNET_LOCK_EX            CFS_PERCPT_LOCK_EX
+
+static inline int lnet_is_route_alive(lnet_route_t *route)
+{
+       if (!route->lr_gateway->lp_alive)
+               return 0; /* gateway is down */
+       if ((route->lr_gateway->lp_ping_feats &
+            LNET_PING_FEAT_NI_STATUS) == 0)
+               return 1; /* no NI status, assume it's alive */
+       /* has NI status, check # down NIs */
+       return route->lr_downis == 0;
+}
+
 static inline int lnet_is_wire_handle_none (lnet_handle_wire_t *wh)
 {
         return (wh->wh_interface_cookie == LNET_WIRE_HANDLE_COOKIE_NONE &&
@@ -88,12 +121,77 @@ static inline int lnet_md_unlinkable (lnet_libmd_t *md)
                 lnet_md_exhausted(md));
 }
 
+#define lnet_cpt_table()       (the_lnet.ln_cpt_table)
+#define lnet_cpt_current()     cfs_cpt_current(the_lnet.ln_cpt_table, 1)
+
+static inline int
+lnet_cpt_of_cookie(__u64 cookie)
+{
+       unsigned int cpt = (cookie >> LNET_COOKIE_TYPE_BITS) & LNET_CPT_MASK;
+
+       /* LNET_CPT_NUMBER doesn't have to be power2, which means we can
+        * get illegal cpt from it's invalid cookie */
+       return cpt < LNET_CPT_NUMBER ? cpt : cpt % LNET_CPT_NUMBER;
+}
+
+static inline void
+lnet_res_lock(int cpt)
+{
+       cfs_percpt_lock(the_lnet.ln_res_lock, cpt);
+}
+
+static inline void
+lnet_res_unlock(int cpt)
+{
+       cfs_percpt_unlock(the_lnet.ln_res_lock, cpt);
+}
+
+static inline int
+lnet_res_lock_current(void)
+{
+       int cpt = lnet_cpt_current();
+
+       lnet_res_lock(cpt);
+       return cpt;
+}
+
+static inline void
+lnet_net_lock(int cpt)
+{
+       cfs_percpt_lock(the_lnet.ln_net_lock, cpt);
+}
+
+static inline void
+lnet_net_unlock(int cpt)
+{
+       cfs_percpt_unlock(the_lnet.ln_net_lock, cpt);
+}
+
+static inline int
+lnet_net_lock_current(void)
+{
+       int cpt = lnet_cpt_current();
+
+       lnet_net_lock(cpt);
+       return cpt;
+}
+
+#define LNET_LOCK()            lnet_net_lock(LNET_LOCK_EX)
+#define LNET_UNLOCK()          lnet_net_unlock(LNET_LOCK_EX)
+
 #ifdef __KERNEL__
-#define LNET_LOCK()        spin_lock(&the_lnet.ln_lock)
-#define LNET_UNLOCK()      spin_unlock(&the_lnet.ln_lock)
-#define LNET_MUTEX_DOWN(m) mutex_down(m)
-#define LNET_MUTEX_UP(m)   mutex_up(m)
-#else
+
+#define lnet_ptl_lock(ptl)     spin_lock(&(ptl)->ptl_lock)
+#define lnet_ptl_unlock(ptl)   spin_unlock(&(ptl)->ptl_lock)
+#define lnet_eq_wait_lock()    spin_lock(&the_lnet.ln_eq_wait_lock)
+#define lnet_eq_wait_unlock()  spin_unlock(&the_lnet.ln_eq_wait_lock)
+#define lnet_ni_lock(ni)       spin_lock(&(ni)->ni_lock)
+#define lnet_ni_unlock(ni)     spin_unlock(&(ni)->ni_lock)
+#define LNET_MUTEX_LOCK(m)     mutex_lock(m)
+#define LNET_MUTEX_UNLOCK(m)   mutex_unlock(m)
+
+#else /* !__KERNEL__ */
+
 # ifndef HAVE_LIBPTHREAD
 #define LNET_SINGLE_THREADED_LOCK(l)            \
 do {                                            \
@@ -107,143 +205,224 @@ do {                                            \
         (l) = 0;                                \
 } while (0)
 
-#define LNET_LOCK()        LNET_SINGLE_THREADED_LOCK(the_lnet.ln_lock)
-#define LNET_UNLOCK()      LNET_SINGLE_THREADED_UNLOCK(the_lnet.ln_lock)
-#define LNET_MUTEX_DOWN(m) LNET_SINGLE_THREADED_LOCK(*(m))
-#define LNET_MUTEX_UP(m)   LNET_SINGLE_THREADED_UNLOCK(*(m))
-# else
-#define LNET_LOCK()        pthread_mutex_lock(&the_lnet.ln_lock)
-#define LNET_UNLOCK()      pthread_mutex_unlock(&the_lnet.ln_lock)
-#define LNET_MUTEX_DOWN(m) pthread_mutex_lock(m)
-#define LNET_MUTEX_UP(m)   pthread_mutex_unlock(m)
-# endif
-#endif
+#define LNET_MUTEX_LOCK(m)     LNET_SINGLE_THREADED_LOCK(*(m))
+#define LNET_MUTEX_UNLOCK(m)   LNET_SINGLE_THREADED_UNLOCK(*(m))
+
+#define lnet_ptl_lock(ptl)                     \
+       LNET_SINGLE_THREADED_LOCK((ptl)->ptl_lock)
+#define lnet_ptl_unlock(ptl)                   \
+       LNET_SINGLE_THREADED_UNLOCK((ptl)->ptl_lock)
+
+#define lnet_eq_wait_lock()                    \
+       LNET_SINGLE_THREADED_LOCK(the_lnet.ln_eq_wait_lock)
+#define lnet_eq_wait_unlock()                  \
+       LNET_SINGLE_THREADED_UNLOCK(the_lnet.ln_eq_wait_lock)
+
+#define lnet_ni_lock(ni)                       \
+       LNET_SINGLE_THREADED_LOCK((ni)->ni_lock)
+#define lnet_ni_unlock(ni)                     \
+       LNET_SINGLE_THREADED_UNLOCK((ni)->ni_lock)
+
+# else /* HAVE_LIBPTHREAD */
+
+#define LNET_MUTEX_LOCK(m)     pthread_mutex_lock(m)
+#define LNET_MUTEX_UNLOCK(m)   pthread_mutex_unlock(m)
+
+#define lnet_ptl_lock(ptl)     pthread_mutex_lock(&(ptl)->ptl_lock)
+#define lnet_ptl_unlock(ptl)   pthread_mutex_unlock(&(ptl)->ptl_lock)
+
+#define lnet_eq_wait_lock()    pthread_mutex_lock(&the_lnet.ln_eq_wait_lock)
+#define lnet_eq_wait_unlock()  pthread_mutex_unlock(&the_lnet.ln_eq_wait_lock)
+
+#define lnet_ni_lock(ni)       pthread_mutex_lock(&(ni)->ni_lock)
+#define lnet_ni_unlock(ni)     pthread_mutex_unlock(&(ni)->ni_lock)
+
+# endif /* HAVE_LIBPTHREAD */
+#endif /* __KERNEL__ */
 
 #define MAX_PORTALS     64
 
+/* these are only used by code with LNET_USE_LIB_FREELIST, but we still
+ * exported them to !LNET_USE_LIB_FREELIST for easy implemetation */
+#define LNET_FL_MAX_MES                2048
+#define LNET_FL_MAX_MDS                2048
+#define LNET_FL_MAX_EQS                512
+#define LNET_FL_MAX_MSGS       2048    /* Outstanding messages */
+
 #ifdef LNET_USE_LIB_FREELIST
 
-#define MAX_MES         2048
-#define MAX_MDS         2048
-#define MAX_MSGS        2048    /* Outstanding messages */
-#define MAX_EQS         512
+int lnet_freelist_init(lnet_freelist_t *fl, int n, int size);
+void lnet_freelist_fini(lnet_freelist_t *fl);
 
 static inline void *
 lnet_freelist_alloc (lnet_freelist_t *fl)
 {
-        /* ALWAYS called with liblock held */
-        lnet_freeobj_t *o;
+       /* ALWAYS called with liblock held */
+       lnet_freeobj_t *o;
 
-        if (list_empty (&fl->fl_list))
-                return (NULL);
+       if (list_empty(&fl->fl_list))
+               return NULL;
 
-        o = list_entry (fl->fl_list.next, lnet_freeobj_t, fo_list);
-        list_del (&o->fo_list);
-        return ((void *)&o->fo_contents);
+       o = list_entry(fl->fl_list.next, lnet_freeobj_t, fo_list);
+       list_del(&o->fo_list);
+       return (void *)&o->fo_contents;
 }
 
 static inline void
 lnet_freelist_free (lnet_freelist_t *fl, void *obj)
 {
-        /* ALWAYS called with liblock held */
-        lnet_freeobj_t *o = list_entry (obj, lnet_freeobj_t, fo_contents);
+       /* ALWAYS called with liblock held */
+       lnet_freeobj_t *o = list_entry(obj, lnet_freeobj_t, fo_contents);
 
-        list_add (&o->fo_list, &fl->fl_list);
+       list_add(&o->fo_list, &fl->fl_list);
 }
 
 
 static inline lnet_eq_t *
 lnet_eq_alloc (void)
 {
-        /* NEVER called with liblock held */
-        lnet_eq_t     *eq;
+       /* NEVER called with resource lock held */
+       struct lnet_res_container *rec = &the_lnet.ln_eq_container;
+       lnet_eq_t                 *eq;
 
-        LNET_LOCK();
-        eq = (lnet_eq_t *)lnet_freelist_alloc(&the_lnet.ln_free_eqs);
-        LNET_UNLOCK();
+       LASSERT(LNET_CPT_NUMBER == 1);
 
-        return (eq);
+       lnet_res_lock(0);
+       eq = (lnet_eq_t *)lnet_freelist_alloc(&rec->rec_freelist);
+       lnet_res_unlock(0);
+
+       return eq;
 }
 
 static inline void
-lnet_eq_free (lnet_eq_t *eq)
+lnet_eq_free_locked(lnet_eq_t *eq)
 {
-        /* ALWAYS called with liblock held */
-        lnet_freelist_free(&the_lnet.ln_free_eqs, eq);
+       /* ALWAYS called with resource lock held */
+       struct lnet_res_container *rec = &the_lnet.ln_eq_container;
+
+       LASSERT(LNET_CPT_NUMBER == 1);
+       lnet_freelist_free(&rec->rec_freelist, eq);
+}
+
+static inline void
+lnet_eq_free(lnet_eq_t *eq)
+{
+       lnet_res_lock(0);
+       lnet_eq_free_locked(eq);
+       lnet_res_unlock(0);
 }
 
 static inline lnet_libmd_t *
 lnet_md_alloc (lnet_md_t *umd)
 {
-        /* NEVER called with liblock held */
-        lnet_libmd_t  *md;
+       /* NEVER called with resource lock held */
+       struct lnet_res_container *rec = the_lnet.ln_md_containers[0];
+       lnet_libmd_t              *md;
+
+       LASSERT(LNET_CPT_NUMBER == 1);
 
-        LNET_LOCK();
-        md = (lnet_libmd_t *)lnet_freelist_alloc(&the_lnet.ln_free_mds);
-        LNET_UNLOCK();
+       lnet_res_lock(0);
+       md = (lnet_libmd_t *)lnet_freelist_alloc(&rec->rec_freelist);
+       lnet_res_unlock(0);
 
-        if (md != NULL)
-                CFS_INIT_LIST_HEAD(&md->md_list);
+       if (md != NULL)
+               INIT_LIST_HEAD(&md->md_list);
 
-        return (md);
+       return md;
 }
 
 static inline void
-lnet_md_free (lnet_libmd_t *md)
+lnet_md_free_locked(lnet_libmd_t *md)
 {
-        /* ALWAYS called with liblock held */
-        lnet_freelist_free (&the_lnet.ln_free_mds, md);
+       /* ALWAYS called with resource lock held */
+       struct lnet_res_container *rec = the_lnet.ln_md_containers[0];
+
+       LASSERT(LNET_CPT_NUMBER == 1);
+       lnet_freelist_free(&rec->rec_freelist, md);
+}
+
+static inline void
+lnet_md_free(lnet_libmd_t *md)
+{
+       lnet_res_lock(0);
+       lnet_md_free_locked(md);
+       lnet_res_unlock(0);
 }
 
 static inline lnet_me_t *
-lnet_me_alloc (void)
+lnet_me_alloc(void)
 {
-        /* NEVER called with liblock held */
-        lnet_me_t     *me;
+       /* NEVER called with resource lock held */
+       struct lnet_res_container *rec = the_lnet.ln_me_containers[0];
+       lnet_me_t                 *me;
 
-        LNET_LOCK();
-        me = (lnet_me_t *)lnet_freelist_alloc(&the_lnet.ln_free_mes);
-        LNET_UNLOCK();
+       LASSERT(LNET_CPT_NUMBER == 1);
 
-        return (me);
+       lnet_res_lock(0);
+       me = (lnet_me_t *)lnet_freelist_alloc(&rec->rec_freelist);
+       lnet_res_unlock(0);
+
+       return me;
+}
+
+static inline void
+lnet_me_free_locked(lnet_me_t *me)
+{
+       /* ALWAYS called with resource lock held */
+       struct lnet_res_container *rec = the_lnet.ln_me_containers[0];
+
+       LASSERT(LNET_CPT_NUMBER == 1);
+       lnet_freelist_free(&rec->rec_freelist, me);
 }
 
 static inline void
-lnet_me_free (lnet_me_t *me)
+lnet_me_free(lnet_me_t *me)
 {
-        /* ALWAYS called with liblock held */
-        lnet_freelist_free (&the_lnet.ln_free_mes, me);
+       lnet_res_lock(0);
+       lnet_me_free_locked(me);
+       lnet_res_unlock(0);
 }
 
 static inline lnet_msg_t *
 lnet_msg_alloc (void)
 {
-        /* NEVER called with liblock held */
-        lnet_msg_t    *msg;
+       /* NEVER called with network lock held */
+       struct lnet_msg_container *msc = the_lnet.ln_msg_containers[0];
+       lnet_msg_t                *msg;
 
-        LNET_LOCK();
-        msg = (lnet_msg_t *)lnet_freelist_alloc(&the_lnet.ln_free_msgs);
-        LNET_UNLOCK();
+       LASSERT(LNET_CPT_NUMBER == 1);
 
-        if (msg != NULL) {
-                /* NULL pointers, clear flags etc */
-                memset (msg, 0, sizeof (*msg));
-#ifdef CRAY_XT3
-                msg->msg_ev.uid = LNET_UID_ANY;
-#endif
-        }
-        return(msg);
+       lnet_net_lock(0);
+       msg = (lnet_msg_t *)lnet_freelist_alloc(&msc->msc_freelist);
+       lnet_net_unlock(0);
+
+       if (msg != NULL) {
+               /* NULL pointers, clear flags etc */
+               memset(msg, 0, sizeof(*msg));
+       }
+       return msg;
+}
+
+static inline void
+lnet_msg_free_locked(lnet_msg_t *msg)
+{
+       /* ALWAYS called with network lock held */
+       struct lnet_msg_container *msc = the_lnet.ln_msg_containers[0];
+
+       LASSERT(LNET_CPT_NUMBER == 1);
+       LASSERT(!msg->msg_onactivelist);
+       lnet_freelist_free(&msc->msc_freelist, msg);
 }
 
 static inline void
 lnet_msg_free (lnet_msg_t *msg)
 {
-        /* ALWAYS called with liblock held */
-        LASSERT (!msg->msg_onactivelist);
-        lnet_freelist_free(&the_lnet.ln_free_msgs, msg);
+       lnet_net_lock(0);
+       lnet_msg_free_locked(msg);
+       lnet_net_unlock(0);
 }
 
-#else
+#else /* !LNET_USE_LIB_FREELIST */
 
 static inline lnet_eq_t *
 lnet_eq_alloc (void)
@@ -256,10 +435,10 @@ lnet_eq_alloc (void)
 }
 
 static inline void
-lnet_eq_free (lnet_eq_t *eq)
+lnet_eq_free(lnet_eq_t *eq)
 {
-        /* ALWAYS called with liblock held */
-        LIBCFS_FREE(eq, sizeof(*eq));
+       /* ALWAYS called with resource lock held */
+       LIBCFS_FREE(eq, sizeof(*eq));
 }
 
 static inline lnet_libmd_t *
@@ -281,28 +460,28 @@ lnet_md_alloc (lnet_md_t *umd)
 
         LIBCFS_ALLOC(md, size);
 
-        if (md != NULL) {
-                /* Set here in case of early free */
-                md->md_options = umd->options;
-                md->md_niov = niov;
-                CFS_INIT_LIST_HEAD(&md->md_list);
-        }
+       if (md != NULL) {
+               /* Set here in case of early free */
+               md->md_options = umd->options;
+               md->md_niov = niov;
+               INIT_LIST_HEAD(&md->md_list);
+       }
 
-        return (md);
+       return md;
 }
 
 static inline void
-lnet_md_free (lnet_libmd_t *md)
+lnet_md_free(lnet_libmd_t *md)
 {
-        /* ALWAYS called with liblock held */
-        unsigned int  size;
+       /* ALWAYS called with resource lock held */
+       unsigned int  size;
 
-        if ((md->md_options & LNET_MD_KIOV) != 0)
-                size = offsetof(lnet_libmd_t, md_iov.kiov[md->md_niov]);
-        else
-                size = offsetof(lnet_libmd_t, md_iov.iov[md->md_niov]);
+       if ((md->md_options & LNET_MD_KIOV) != 0)
+               size = offsetof(lnet_libmd_t, md_iov.kiov[md->md_niov]);
+       else
+               size = offsetof(lnet_libmd_t, md_iov.iov[md->md_niov]);
 
-        LIBCFS_FREE(md, size);
+       LIBCFS_FREE(md, size);
 }
 
 static inline lnet_me_t *
@@ -318,8 +497,8 @@ lnet_me_alloc (void)
 static inline void
 lnet_me_free(lnet_me_t *me)
 {
-        /* ALWAYS called with liblock held */
-        LIBCFS_FREE(me, sizeof(*me));
+       /* ALWAYS called with resource lock held */
+       LIBCFS_FREE(me, sizeof(*me));
 }
 
 static inline lnet_msg_t *
@@ -330,28 +509,36 @@ lnet_msg_alloc(void)
 
         LIBCFS_ALLOC(msg, sizeof(*msg));
 
-        if (msg != NULL) {
-                /* NULL pointers, clear flags etc */
-                memset (msg, 0, sizeof (*msg));
-#ifdef CRAY_XT3
-                msg->msg_ev.uid = LNET_UID_ANY;
-#endif
-        }
+        /* no need to zero, LIBCFS_ALLOC does for us */
         return (msg);
 }
 
 static inline void
 lnet_msg_free(lnet_msg_t *msg)
 {
-        /* ALWAYS called with liblock held */
-        LASSERT (!msg->msg_onactivelist);
-        LIBCFS_FREE(msg, sizeof(*msg));
+       /* ALWAYS called with network lock held */
+       LASSERT(!msg->msg_onactivelist);
+       LIBCFS_FREE(msg, sizeof(*msg));
 }
-#endif
 
-extern lnet_libhandle_t *lnet_lookup_cookie (__u64 cookie, int type);
-extern void lnet_initialise_handle (lnet_libhandle_t *lh, int type);
-extern void lnet_invalidate_handle (lnet_libhandle_t *lh);
+#define lnet_eq_free_locked(eq)                lnet_eq_free(eq)
+#define lnet_md_free_locked(md)                lnet_md_free(md)
+#define lnet_me_free_locked(me)                lnet_me_free(me)
+#define lnet_msg_free_locked(msg)      lnet_msg_free(msg)
+
+#endif /* LNET_USE_LIB_FREELIST */
+
+lnet_libhandle_t *lnet_res_lh_lookup(struct lnet_res_container *rec,
+                                    __u64 cookie);
+void lnet_res_lh_initialize(struct lnet_res_container *rec,
+                           lnet_libhandle_t *lh);
+static inline void
+lnet_res_lh_invalidate(lnet_libhandle_t *lh)
+{
+       /* ALWAYS called with resource lock held */
+       /* NB: cookie is still useful, don't reset it */
+       list_del(&lh->lh_hash_chain);
+}
 
 static inline void
 lnet_eq2handle (lnet_handle_eq_t *handle, lnet_eq_t *eq)
@@ -365,15 +552,16 @@ lnet_eq2handle (lnet_handle_eq_t *handle, lnet_eq_t *eq)
 }
 
 static inline lnet_eq_t *
-lnet_handle2eq (lnet_handle_eq_t *handle)
+lnet_handle2eq(lnet_handle_eq_t *handle)
 {
-        /* ALWAYS called with liblock held */
-        lnet_libhandle_t *lh = lnet_lookup_cookie(handle->cookie,
-                                                  LNET_COOKIE_TYPE_EQ);
-        if (lh == NULL)
-                return (NULL);
+       /* ALWAYS called with resource lock held */
+       lnet_libhandle_t *lh;
 
-        return (lh_entry (lh, lnet_eq_t, eq_lh));
+       lh = lnet_res_lh_lookup(&the_lnet.ln_eq_container, handle->cookie);
+       if (lh == NULL)
+               return NULL;
+
+       return lh_entry(lh, lnet_eq_t, eq_lh);
 }
 
 static inline void
@@ -383,32 +571,38 @@ lnet_md2handle (lnet_handle_md_t *handle, lnet_libmd_t *md)
 }
 
 static inline lnet_libmd_t *
-lnet_handle2md (lnet_handle_md_t *handle)
+lnet_handle2md(lnet_handle_md_t *handle)
 {
-        /* ALWAYS called with liblock held */
-        lnet_libhandle_t *lh = lnet_lookup_cookie(handle->cookie,
-                                                  LNET_COOKIE_TYPE_MD);
-        if (lh == NULL)
-                return (NULL);
+       /* ALWAYS called with resource lock held */
+       lnet_libhandle_t *lh;
+       int              cpt;
+
+       cpt = lnet_cpt_of_cookie(handle->cookie);
+       lh = lnet_res_lh_lookup(the_lnet.ln_md_containers[cpt],
+                               handle->cookie);
+       if (lh == NULL)
+               return NULL;
 
-        return (lh_entry (lh, lnet_libmd_t, md_lh));
+       return lh_entry(lh, lnet_libmd_t, md_lh);
 }
 
 static inline lnet_libmd_t *
-lnet_wire_handle2md (lnet_handle_wire_t *wh)
+lnet_wire_handle2md(lnet_handle_wire_t *wh)
 {
-        /* ALWAYS called with liblock held */
-        lnet_libhandle_t *lh;
+       /* ALWAYS called with resource lock held */
+       lnet_libhandle_t *lh;
+       int              cpt;
 
-        if (wh->wh_interface_cookie != the_lnet.ln_interface_cookie)
-                return (NULL);
+       if (wh->wh_interface_cookie != the_lnet.ln_interface_cookie)
+               return NULL;
 
-        lh = lnet_lookup_cookie(wh->wh_object_cookie,
-                                LNET_COOKIE_TYPE_MD);
-        if (lh == NULL)
-                return (NULL);
+       cpt = lnet_cpt_of_cookie(wh->wh_object_cookie);
+       lh = lnet_res_lh_lookup(the_lnet.ln_md_containers[cpt],
+                               wh->wh_object_cookie);
+       if (lh == NULL)
+               return NULL;
 
-        return (lh_entry (lh, lnet_libmd_t, md_lh));
+       return lh_entry(lh, lnet_libmd_t, md_lh);
 }
 
 static inline void
@@ -418,15 +612,19 @@ lnet_me2handle (lnet_handle_me_t *handle, lnet_me_t *me)
 }
 
 static inline lnet_me_t *
-lnet_handle2me (lnet_handle_me_t *handle)
+lnet_handle2me(lnet_handle_me_t *handle)
 {
-        /* ALWAYS called with liblock held */
-        lnet_libhandle_t *lh = lnet_lookup_cookie(handle->cookie,
-                                                  LNET_COOKIE_TYPE_ME);
-        if (lh == NULL)
-                return (NULL);
+       /* ALWAYS called with resource lock held */
+       lnet_libhandle_t *lh;
+       int              cpt;
+
+       cpt = lnet_cpt_of_cookie(handle->cookie);
+       lh = lnet_res_lh_lookup(the_lnet.ln_me_containers[cpt],
+                               handle->cookie);
+       if (lh == NULL)
+               return NULL;
 
-        return (lh_entry (lh, lnet_me_t, me_lh));
+       return lh_entry(lh, lnet_me_t, me_lh);
 }
 
 static inline void
@@ -454,46 +652,57 @@ lnet_isrouter(lnet_peer_t *lp)
 }
 
 static inline void
-lnet_ni_addref_locked(lnet_ni_t *ni)
+lnet_ni_addref_locked(lnet_ni_t *ni, int cpt)
 {
-        LASSERT (ni->ni_refcount > 0);
-        ni->ni_refcount++;
+       LASSERT(cpt >= 0 && cpt < LNET_CPT_NUMBER);
+       LASSERT(*ni->ni_refs[cpt] >= 0);
+
+       (*ni->ni_refs[cpt])++;
 }
 
 static inline void
 lnet_ni_addref(lnet_ni_t *ni)
 {
-        LNET_LOCK();
-        lnet_ni_addref_locked(ni);
-        LNET_UNLOCK();
+       lnet_net_lock(0);
+       lnet_ni_addref_locked(ni, 0);
+       lnet_net_unlock(0);
 }
 
 static inline void
-lnet_ni_decref_locked(lnet_ni_t *ni)
+lnet_ni_decref_locked(lnet_ni_t *ni, int cpt)
 {
-        LASSERT (ni->ni_refcount > 0);
-        ni->ni_refcount--;
-        if (ni->ni_refcount == 0)
-                list_add_tail(&ni->ni_list, &the_lnet.ln_zombie_nis);
+       LASSERT(cpt >= 0 && cpt < LNET_CPT_NUMBER);
+       LASSERT(*ni->ni_refs[cpt] > 0);
+
+       (*ni->ni_refs[cpt])--;
 }
 
 static inline void
 lnet_ni_decref(lnet_ni_t *ni)
 {
-        LNET_LOCK();
-        lnet_ni_decref_locked(ni);
-        LNET_UNLOCK();
+       lnet_net_lock(0);
+       lnet_ni_decref_locked(ni, 0);
+       lnet_net_unlock(0);
 }
 
-static inline struct list_head *
-lnet_nid2peerhash (lnet_nid_t nid)
+void lnet_ni_free(lnet_ni_t *ni);
+
+static inline int
+lnet_nid2peerhash(lnet_nid_t nid)
 {
-        unsigned int idx = LNET_NIDADDR(nid) % LNET_PEER_HASHSIZE;
+       return hash_long(nid, LNET_PEER_HASH_BITS);
+}
 
-        return &the_lnet.ln_peer_hash[idx];
+static inline struct list_head *
+lnet_net2rnethash(__u32 net)
+{
+       return &the_lnet.ln_remote_nets_hash[(LNET_NETNUM(net) +
+               LNET_NETTYP(net)) &
+               ((1U << the_lnet.ln_remote_nets_hbits) - 1)];
 }
 
 extern lnd_t the_lolnd;
+extern int avoid_asym_router_failure;
 
 #ifndef __KERNEL__
 /* unconditional registration */
@@ -514,66 +723,169 @@ do {                                                                    \
 } while (0)
 #endif
 
-#ifdef CRAY_XT3
-inline static void
-lnet_set_msg_uid(lnet_ni_t *ni, lnet_msg_t *msg, lnet_uid_t uid)
-{
-        LASSERT (msg->msg_ev.uid == LNET_UID_ANY);
-        msg->msg_ev.uid = uid;
-}
-#endif
-
-extern lnet_ni_t *lnet_nid2ni_locked (lnet_nid_t nid);
-extern lnet_ni_t *lnet_net2ni_locked (__u32 net);
-static inline lnet_ni_t *
-lnet_net2ni (__u32 net)
-{
-        lnet_ni_t *ni;
-
-        LNET_LOCK();
-        ni = lnet_net2ni_locked(net);
-        LNET_UNLOCK();
-
-        return ni;
-}
+extern int lnet_cpt_of_nid_locked(lnet_nid_t nid);
+extern int lnet_cpt_of_nid(lnet_nid_t nid);
+extern lnet_ni_t *lnet_nid2ni_locked(lnet_nid_t nid, int cpt);
+extern lnet_ni_t *lnet_net2ni_locked(__u32 net, int cpt);
+extern lnet_ni_t *lnet_net2ni(__u32 net);
 
-int lnet_notify(lnet_ni_t *ni, lnet_nid_t peer, int alive, time_t when);
-void lnet_notify_locked(lnet_peer_t *lp, int notifylnd, int alive, time_t when);
-int lnet_add_route(__u32 net, unsigned int hops, lnet_nid_t gateway_nid);
+int lnet_notify(lnet_ni_t *ni, lnet_nid_t peer, int alive, cfs_time_t when);
+void lnet_notify_locked(lnet_peer_t *lp, int notifylnd, int alive, cfs_time_t when);
+int lnet_add_route(__u32 net, unsigned int hops, lnet_nid_t gateway_nid,
+                  unsigned int priority);
 int lnet_check_routes(void);
 int lnet_del_route(__u32 net, lnet_nid_t gw_nid);
 void lnet_destroy_routes(void);
 int lnet_get_route(int idx, __u32 *net, __u32 *hops,
-                   lnet_nid_t *gateway, __u32 *alive);
+                  lnet_nid_t *gateway, __u32 *alive, __u32 *priority);
+int lnet_get_net_config(int idx,
+                       __u32 *cpt_count,
+                       __u64 *nid,
+                       int *peer_timeout,
+                       int *peer_tx_credits,
+                       int *peer_rtr_cr,
+                       int *max_tx_credits,
+                       struct lnet_ioctl_net_config *net_config);
+int lnet_get_rtr_pool_cfg(int idx, struct lnet_ioctl_pool_cfg *pool_cfg);
+
 void lnet_proc_init(void);
 void lnet_proc_fini(void);
-void lnet_init_rtrpools(void);
-int  lnet_alloc_rtrpools(int im_a_router);
-void lnet_free_rtrpools(void);
+int  lnet_rtrpools_alloc(int im_a_router);
+void lnet_destroy_rtrbuf(lnet_rtrbuf_t *rb, int npages);
+int  lnet_rtrpools_adjust(int tiny, int small, int large);
+int lnet_rtrpools_enable(void);
+void lnet_rtrpools_disable(void);
+void lnet_rtrpools_free(int keep_pools);
 lnet_remotenet_t *lnet_find_net_locked (__u32 net);
+int lnet_dyn_add_ni(lnet_pid_t requested_pid, char *nets,
+                   __s32 peer_timeout, __s32 peer_cr, __s32 peer_buf_cr,
+                   __s32 credits);
+int lnet_dyn_del_ni(__u32 net);
 
 int lnet_islocalnid(lnet_nid_t nid);
 int lnet_islocalnet(__u32 net);
 
+void lnet_msg_attach_md(lnet_msg_t *msg, lnet_libmd_t *md,
+                       unsigned int offset, unsigned int mlen);
+void lnet_msg_detach_md(lnet_msg_t *msg, int status);
 void lnet_build_unlink_event(lnet_libmd_t *md, lnet_event_t *ev);
-void lnet_enq_event_locked(lnet_eq_t *eq, lnet_event_t *ev);
+void lnet_build_msg_event(lnet_msg_t *msg, lnet_event_kind_t ev_type);
+void lnet_msg_commit(lnet_msg_t *msg, int cpt);
+void lnet_msg_decommit(lnet_msg_t *msg, int cpt, int status);
+
+void lnet_eq_enqueue_event(lnet_eq_t *eq, lnet_event_t *ev);
 void lnet_prep_send(lnet_msg_t *msg, int type, lnet_process_id_t target,
                     unsigned int offset, unsigned int len);
-int lnet_send(lnet_nid_t nid, lnet_msg_t *msg);
-void lnet_return_credits_locked (lnet_msg_t *msg);
-void lnet_match_blocked_msg(lnet_libmd_t *md);
+int lnet_send(lnet_nid_t nid, lnet_msg_t *msg, lnet_nid_t rtr_nid);
+void lnet_return_tx_credits_locked(lnet_msg_t *msg);
+void lnet_return_rx_credits_locked(lnet_msg_t *msg);
+void lnet_schedule_blocked_locked(lnet_rtrbufpool_t *rbp);
+void lnet_drop_routed_msgs_locked(struct list_head *list, int cpt);
+
+/* portals functions */
+/* portals attributes */
+static inline int
+lnet_ptl_is_lazy(lnet_portal_t *ptl)
+{
+       return !!(ptl->ptl_options & LNET_PTL_LAZY);
+}
+
+static inline int
+lnet_ptl_is_unique(lnet_portal_t *ptl)
+{
+       return !!(ptl->ptl_options & LNET_PTL_MATCH_UNIQUE);
+}
+
+static inline int
+lnet_ptl_is_wildcard(lnet_portal_t *ptl)
+{
+       return !!(ptl->ptl_options & LNET_PTL_MATCH_WILDCARD);
+}
+
+static inline void
+lnet_ptl_setopt(lnet_portal_t *ptl, int opt)
+{
+       ptl->ptl_options |= opt;
+}
+
+static inline void
+lnet_ptl_unsetopt(lnet_portal_t *ptl, int opt)
+{
+       ptl->ptl_options &= ~opt;
+}
+
+/* match-table functions */
+struct list_head *lnet_mt_match_head(struct lnet_match_table *mtable,
+                              lnet_process_id_t id, __u64 mbits);
+struct lnet_match_table *lnet_mt_of_attach(unsigned int index,
+                                          lnet_process_id_t id, __u64 mbits,
+                                          __u64 ignore_bits,
+                                          lnet_ins_pos_t pos);
+int lnet_mt_match_md(struct lnet_match_table *mtable,
+                    struct lnet_match_info *info, struct lnet_msg *msg);
+
+/* portals match/attach functions */
+void lnet_ptl_attach_md(lnet_me_t *me, lnet_libmd_t *md,
+                       struct list_head *matches, struct list_head *drops);
+void lnet_ptl_detach_md(lnet_me_t *me, lnet_libmd_t *md);
+int lnet_ptl_match_md(struct lnet_match_info *info, struct lnet_msg *msg);
+
+/* initialized and finalize portals */
+int lnet_portals_create(void);
+void lnet_portals_destroy(void);
+
+/* message functions */
 int lnet_parse (lnet_ni_t *ni, lnet_hdr_t *hdr,
                 lnet_nid_t fromnid, void *private, int rdma_req);
+int lnet_parse_local(lnet_ni_t *ni, lnet_msg_t *msg);
+int lnet_parse_forward_locked(lnet_ni_t *ni, lnet_msg_t *msg);
+
 void lnet_recv(lnet_ni_t *ni, void *private, lnet_msg_t *msg, int delayed,
                unsigned int offset, unsigned int mlen, unsigned int rlen);
+void lnet_ni_recv(lnet_ni_t *ni, void *private, lnet_msg_t *msg,
+                 int delayed, unsigned int offset,
+                 unsigned int mlen, unsigned int rlen);
+
 lnet_msg_t *lnet_create_reply_msg (lnet_ni_t *ni, lnet_msg_t *get_msg);
 void lnet_set_reply_msg_len(lnet_ni_t *ni, lnet_msg_t *msg, unsigned int len);
+
 void lnet_finalize(lnet_ni_t *ni, lnet_msg_t *msg, int rc);
 
+void lnet_drop_message(lnet_ni_t *ni, int cpt, void *private,
+                      unsigned int nob);
+void lnet_drop_delayed_msg_list(struct list_head *head, char *reason);
+void lnet_recv_delayed_msg_list(struct list_head *head);
+
+int lnet_msg_container_setup(struct lnet_msg_container *container, int cpt);
+void lnet_msg_container_cleanup(struct lnet_msg_container *container);
+void lnet_msg_containers_destroy(void);
+int lnet_msg_containers_create(void);
+
 char *lnet_msgtyp2str (int type);
 void lnet_print_hdr (lnet_hdr_t * hdr);
 int lnet_fail_nid(lnet_nid_t nid, unsigned int threshold);
 
+/** \addtogroup lnet_fault_simulation @{ */
+
+int lnet_fault_ctl(int cmd, struct libcfs_ioctl_data *data);
+int lnet_fault_init(void);
+void lnet_fault_fini(void);
+
+bool lnet_drop_rule_match(lnet_hdr_t *hdr);
+
+int lnet_delay_rule_add(struct lnet_fault_attr *attr);
+int lnet_delay_rule_del(lnet_nid_t src, lnet_nid_t dst, bool shutdown);
+int lnet_delay_rule_list(int pos, struct lnet_fault_attr *attr,
+                        struct lnet_fault_stat *stat);
+void lnet_delay_rule_reset(void);
+void lnet_delay_rule_check(void);
+bool lnet_delay_rule_match_locked(lnet_hdr_t *hdr, struct lnet_msg *msg);
+
+/** @} lnet_fault_simulation */
+
+void lnet_counters_get(lnet_counters_t *counters);
+void lnet_counters_reset(void);
+
 unsigned int lnet_iov_nob (unsigned int niov, struct iovec *iov);
 int lnet_extract_iov (int dst_niov, struct iovec *dst,
                       int src_niov, struct iovec *src,
@@ -602,7 +914,7 @@ void lnet_copy_kiov2kiov (unsigned int ndkiov, lnet_kiov_t *dkiov,
                           unsigned int soffset, unsigned int nob);
 
 static inline void
-lnet_copy_iov2flat(int dlen, void *dest, unsigned int doffset,
+lnet_copy_iov2flat(int dlen, __user void *dest, unsigned int doffset,
                    unsigned int nsiov, struct iovec *siov, unsigned int soffset,
                    unsigned int nob)
 {
@@ -613,9 +925,9 @@ lnet_copy_iov2flat(int dlen, void *dest, unsigned int doffset,
 }
 
 static inline void
-lnet_copy_kiov2flat(int dlen, void *dest, unsigned int doffset,
-                    unsigned int nsiov, lnet_kiov_t *skiov, unsigned int soffset,
-                    unsigned int nob)
+lnet_copy_kiov2flat(int dlen, void __user *dest, unsigned int doffset,
+                   unsigned int nsiov, lnet_kiov_t *skiov,
+                   unsigned int soffset, unsigned int nob)
 {
         struct iovec diov = {/* .iov_base = */ dest, /* .iov_len = */ dlen};
 
@@ -625,7 +937,8 @@ lnet_copy_kiov2flat(int dlen, void *dest, unsigned int doffset,
 
 static inline void
 lnet_copy_flat2iov(unsigned int ndiov, struct iovec *diov, unsigned int doffset,
-                   int slen, void *src, unsigned int soffset, unsigned int nob)
+                  int slen, void __user *src, unsigned int soffset,
+                  unsigned int nob)
 {
         struct iovec siov = {/*.iov_base = */ src, /*.iov_len = */slen};
         lnet_copy_iov2iov(ndiov, diov, doffset,
@@ -633,8 +946,9 @@ lnet_copy_flat2iov(unsigned int ndiov, struct iovec *diov, unsigned int doffset,
 }
 
 static inline void
-lnet_copy_flat2kiov(unsigned int ndiov, lnet_kiov_t *dkiov, unsigned int doffset,
-                    int slen, void *src, unsigned int soffset, unsigned int nob)
+lnet_copy_flat2kiov(unsigned int ndiov, lnet_kiov_t *dkiov,
+                   unsigned int doffset, int slen, void __user *src,
+                   unsigned int soffset, unsigned int nob)
 {
         struct iovec siov = {/* .iov_base = */ src, /* .iov_len = */ slen};
         lnet_copy_iov2kiov(ndiov, dkiov, doffset,
@@ -658,6 +972,8 @@ void lnet_connect_console_error(int rc, lnet_nid_t peer_nid,
 int lnet_count_acceptor_nis(void);
 int lnet_acceptor_timeout(void);
 int lnet_acceptor_port(void);
+#else
+void lnet_router_checker(void);
 #endif
 
 #ifdef HAVE_LIBPTHREAD
@@ -668,25 +984,41 @@ int lnet_acceptor_port(void);
 int lnet_acceptor_start(void);
 void lnet_acceptor_stop(void);
 
+void lnet_get_tunables(void);
 int lnet_peers_start_down(void);
+int lnet_peer_buffer_credits(lnet_ni_t *ni);
+
 int lnet_router_checker_start(void);
 void lnet_router_checker_stop(void);
-
-int lnet_ping_target_init(void);
-void lnet_ping_target_fini(void);
-int lnet_ping(lnet_process_id_t id, int timeout_ms,
-              lnet_process_id_t *ids, int n_ids);
-
-int lnet_parse_ip2nets (char **networksp, char *ip2nets);
-int lnet_parse_routes (char *route_str, int *im_a_router);
-int lnet_parse_networks (struct list_head *nilist, char *networks);
-
-int lnet_nid2peer_locked(lnet_peer_t **lpp, lnet_nid_t nid);
-lnet_peer_t *lnet_find_peer_locked (lnet_nid_t nid);
-void lnet_clear_peer_table(void);
-void lnet_destroy_peer_table(void);
-int lnet_create_peer_table(void);
+void lnet_router_ni_update_locked(lnet_peer_t *gw, __u32 net);
+void lnet_swap_pinginfo(lnet_ping_info_t *info);
+
+int lnet_parse_ip2nets(char **networksp, char *ip2nets);
+int lnet_parse_routes(char *route_str, int *im_a_router);
+int lnet_parse_networks(struct list_head *nilist, char *networks);
+int lnet_net_unique(__u32 net, struct list_head *nilist);
+
+int lnet_nid2peer_locked(lnet_peer_t **lpp, lnet_nid_t nid, int cpt);
+lnet_peer_t *lnet_find_peer_locked(struct lnet_peer_table *ptable,
+                                  lnet_nid_t nid);
+void lnet_peer_tables_cleanup(lnet_ni_t *ni);
+void lnet_peer_tables_destroy(void);
+int lnet_peer_tables_create(void);
 void lnet_debug_peer(lnet_nid_t nid);
+int lnet_get_peer_info(__u32 peer_index, __u64 *nid,
+                      char alivness[LNET_MAX_STR_LEN],
+                      __u32 *cpt_iter, __u32 *refcount,
+                      __u32 *ni_peer_tx_credits, __u32 *peer_tx_credits,
+                      __u32 *peer_rtr_credits, __u32 *peer_min_rtr_credtis,
+                      __u32 *peer_tx_qnob);
+
+static inline void
+lnet_peer_set_alive(lnet_peer_t *lp)
+{
+       lp->lp_last_alive = lp->lp_last_query = cfs_time_current();
+       if (!lp->lp_alive)
+               lnet_notify_locked(lp, 0, 1, lp->lp_last_alive);
+}
 
 #ifndef __KERNEL__
 static inline int