Whamcloud - gitweb
LU-2456 lnet: DLC user/kernel space glue code
[fs/lustre-release.git] / lnet / include / lnet / lib-lnet.h
index 1abeb33..dc5cf34 100644 (file)
@@ -26,6 +26,8 @@
 /*
  * Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
  * Use is subject to license terms.
+ *
+ * Copyright (c) 2012, 2013, Intel Corporation.
  */
 /*
  * This file is part of Lustre, http://www.lustre.org/
 #ifndef __LNET_LIB_LNET_H__
 #define __LNET_LIB_LNET_H__
 
-#if defined(__linux__)
 #include <lnet/linux/lib-lnet.h>
-#elif defined(__APPLE__)
-#include <lnet/darwin/lib-lnet.h>
-#elif defined(__WINNT__)
-#include <lnet/winnt/lib-lnet.h>
-#else
-#error Unsupported Operating System
-#endif
 
 #include <libcfs/libcfs.h>
 #include <lnet/types.h>
 #include <lnet/lnet.h>
 #include <lnet/lib-types.h>
+#include <lnet/lib-dlc.h>
 
 extern lnet_t  the_lnet;                        /* THE network */
 
@@ -69,7 +64,7 @@ extern lnet_t  the_lnet;                        /* THE network */
 # else /* 64-bit system */
 /*
  * 256 CPTs for thousands of CPUs, allowing more CPTs might make us
- * under risk of consuming all lh_cooke.
+ * under risk of consuming all lh_cookie.
  */
 #  define LNET_CPT_MAX_BITS     8
 # endif /* BITS_PER_LONG == 32 */
@@ -85,6 +80,17 @@ extern lnet_t  the_lnet;                        /* THE network */
 /** exclusive lock */
 #define LNET_LOCK_EX            CFS_PERCPT_LOCK_EX
 
+static inline int lnet_is_route_alive(lnet_route_t *route)
+{
+       if (!route->lr_gateway->lp_alive)
+               return 0; /* gateway is down */
+       if ((route->lr_gateway->lp_ping_feats &
+            LNET_PING_FEAT_NI_STATUS) == 0)
+               return 1; /* no NI status, assume it's alive */
+       /* has NI status, check # down NIs */
+       return route->lr_downis == 0;
+}
+
 static inline int lnet_is_wire_handle_none (lnet_handle_wire_t *wh)
 {
         return (wh->wh_interface_cookie == LNET_WIRE_HANDLE_COOKIE_NONE &&
@@ -149,16 +155,40 @@ lnet_res_lock_current(void)
        return cpt;
 }
 
+static inline void
+lnet_net_lock(int cpt)
+{
+       cfs_percpt_lock(the_lnet.ln_net_lock, cpt);
+}
+
+static inline void
+lnet_net_unlock(int cpt)
+{
+       cfs_percpt_unlock(the_lnet.ln_net_lock, cpt);
+}
+
+static inline int
+lnet_net_lock_current(void)
+{
+       int cpt = lnet_cpt_current();
+
+       lnet_net_lock(cpt);
+       return cpt;
+}
+
+#define LNET_LOCK()            lnet_net_lock(LNET_LOCK_EX)
+#define LNET_UNLOCK()          lnet_net_unlock(LNET_LOCK_EX)
+
 #ifdef __KERNEL__
 
-#define lnet_ptl_lock(ptl)     cfs_spin_lock(&(ptl)->ptl_lock)
-#define lnet_ptl_unlock(ptl)   cfs_spin_unlock(&(ptl)->ptl_lock)
-#define lnet_eq_wait_lock()    cfs_spin_lock(&the_lnet.ln_eq_wait_lock)
-#define lnet_eq_wait_unlock()  cfs_spin_unlock(&the_lnet.ln_eq_wait_lock)
-#define LNET_LOCK()            cfs_spin_lock(&the_lnet.ln_lock)
-#define LNET_UNLOCK()          cfs_spin_unlock(&the_lnet.ln_lock)
-#define LNET_MUTEX_LOCK(m)     cfs_mutex_lock(m)
-#define LNET_MUTEX_UNLOCK(m)   cfs_mutex_unlock(m)
+#define lnet_ptl_lock(ptl)     spin_lock(&(ptl)->ptl_lock)
+#define lnet_ptl_unlock(ptl)   spin_unlock(&(ptl)->ptl_lock)
+#define lnet_eq_wait_lock()    spin_lock(&the_lnet.ln_eq_wait_lock)
+#define lnet_eq_wait_unlock()  spin_unlock(&the_lnet.ln_eq_wait_lock)
+#define lnet_ni_lock(ni)       spin_lock(&(ni)->ni_lock)
+#define lnet_ni_unlock(ni)     spin_unlock(&(ni)->ni_lock)
+#define LNET_MUTEX_LOCK(m)     mutex_lock(m)
+#define LNET_MUTEX_UNLOCK(m)   mutex_unlock(m)
 
 #else /* !__KERNEL__ */
 
@@ -175,8 +205,6 @@ do {                                            \
         (l) = 0;                                \
 } while (0)
 
-#define LNET_LOCK()            LNET_SINGLE_THREADED_LOCK(the_lnet.ln_lock)
-#define LNET_UNLOCK()          LNET_SINGLE_THREADED_UNLOCK(the_lnet.ln_lock)
 #define LNET_MUTEX_LOCK(m)     LNET_SINGLE_THREADED_LOCK(*(m))
 #define LNET_MUTEX_UNLOCK(m)   LNET_SINGLE_THREADED_UNLOCK(*(m))
 
@@ -190,10 +218,13 @@ do {                                            \
 #define lnet_eq_wait_unlock()                  \
        LNET_SINGLE_THREADED_UNLOCK(the_lnet.ln_eq_wait_lock)
 
+#define lnet_ni_lock(ni)                       \
+       LNET_SINGLE_THREADED_LOCK((ni)->ni_lock)
+#define lnet_ni_unlock(ni)                     \
+       LNET_SINGLE_THREADED_UNLOCK((ni)->ni_lock)
+
 # else /* HAVE_LIBPTHREAD */
 
-#define LNET_LOCK()            pthread_mutex_lock(&the_lnet.ln_lock)
-#define LNET_UNLOCK()          pthread_mutex_unlock(&the_lnet.ln_lock)
 #define LNET_MUTEX_LOCK(m)     pthread_mutex_lock(m)
 #define LNET_MUTEX_UNLOCK(m)   pthread_mutex_unlock(m)
 
@@ -203,6 +234,9 @@ do {                                            \
 #define lnet_eq_wait_lock()    pthread_mutex_lock(&the_lnet.ln_eq_wait_lock)
 #define lnet_eq_wait_unlock()  pthread_mutex_unlock(&the_lnet.ln_eq_wait_lock)
 
+#define lnet_ni_lock(ni)       pthread_mutex_lock(&(ni)->ni_lock)
+#define lnet_ni_unlock(ni)     pthread_mutex_unlock(&(ni)->ni_lock)
+
 # endif /* HAVE_LIBPTHREAD */
 #endif /* __KERNEL__ */
 
@@ -223,24 +257,24 @@ void lnet_freelist_fini(lnet_freelist_t *fl);
 static inline void *
 lnet_freelist_alloc (lnet_freelist_t *fl)
 {
-        /* ALWAYS called with liblock held */
-        lnet_freeobj_t *o;
+       /* ALWAYS called with liblock held */
+       lnet_freeobj_t *o;
 
-        if (cfs_list_empty (&fl->fl_list))
-                return (NULL);
+       if (list_empty(&fl->fl_list))
+               return NULL;
 
-        o = cfs_list_entry (fl->fl_list.next, lnet_freeobj_t, fo_list);
-        cfs_list_del (&o->fo_list);
-        return ((void *)&o->fo_contents);
+       o = list_entry(fl->fl_list.next, lnet_freeobj_t, fo_list);
+       list_del(&o->fo_list);
+       return (void *)&o->fo_contents;
 }
 
 static inline void
 lnet_freelist_free (lnet_freelist_t *fl, void *obj)
 {
-        /* ALWAYS called with liblock held */
-        lnet_freeobj_t *o = cfs_list_entry (obj, lnet_freeobj_t, fo_contents);
+       /* ALWAYS called with liblock held */
+       lnet_freeobj_t *o = list_entry(obj, lnet_freeobj_t, fo_contents);
 
-        cfs_list_add (&o->fo_list, &fl->fl_list);
+       list_add(&o->fo_list, &fl->fl_list);
 }
 
 
@@ -292,7 +326,7 @@ lnet_md_alloc (lnet_md_t *umd)
        lnet_res_unlock(0);
 
        if (md != NULL)
-               CFS_INIT_LIST_HEAD(&md->md_list);
+               INIT_LIST_HEAD(&md->md_list);
 
        return md;
 }
@@ -353,19 +387,18 @@ static inline lnet_msg_t *
 lnet_msg_alloc (void)
 {
        /* NEVER called with network lock held */
-       struct lnet_msg_container *msc = &the_lnet.ln_msg_container;
+       struct lnet_msg_container *msc = the_lnet.ln_msg_containers[0];
        lnet_msg_t                *msg;
 
-       LNET_LOCK();
+       LASSERT(LNET_CPT_NUMBER == 1);
+
+       lnet_net_lock(0);
        msg = (lnet_msg_t *)lnet_freelist_alloc(&msc->msc_freelist);
-       LNET_UNLOCK();
+       lnet_net_unlock(0);
 
        if (msg != NULL) {
                /* NULL pointers, clear flags etc */
                memset(msg, 0, sizeof(*msg));
-#ifdef CRAY_XT3
-               msg->msg_ev.uid = LNET_UID_ANY;
-#endif
        }
        return msg;
 }
@@ -374,8 +407,9 @@ static inline void
 lnet_msg_free_locked(lnet_msg_t *msg)
 {
        /* ALWAYS called with network lock held */
-       struct lnet_msg_container *msc = &the_lnet.ln_msg_container;
+       struct lnet_msg_container *msc = the_lnet.ln_msg_containers[0];
 
+       LASSERT(LNET_CPT_NUMBER == 1);
        LASSERT(!msg->msg_onactivelist);
        lnet_freelist_free(&msc->msc_freelist, msg);
 }
@@ -383,9 +417,9 @@ lnet_msg_free_locked(lnet_msg_t *msg)
 static inline void
 lnet_msg_free (lnet_msg_t *msg)
 {
-       LNET_LOCK();
+       lnet_net_lock(0);
        lnet_msg_free_locked(msg);
-       LNET_UNLOCK();
+       lnet_net_unlock(0);
 }
 
 #else /* !LNET_USE_LIB_FREELIST */
@@ -426,14 +460,14 @@ lnet_md_alloc (lnet_md_t *umd)
 
         LIBCFS_ALLOC(md, size);
 
-        if (md != NULL) {
-                /* Set here in case of early free */
-                md->md_options = umd->options;
-                md->md_niov = niov;
-                CFS_INIT_LIST_HEAD(&md->md_list);
-        }
+       if (md != NULL) {
+               /* Set here in case of early free */
+               md->md_options = umd->options;
+               md->md_niov = niov;
+               INIT_LIST_HEAD(&md->md_list);
+       }
 
-        return (md);
+       return md;
 }
 
 static inline void
@@ -476,12 +510,6 @@ lnet_msg_alloc(void)
         LIBCFS_ALLOC(msg, sizeof(*msg));
 
         /* no need to zero, LIBCFS_ALLOC does for us */
-
-#ifdef CRAY_XT3
-        if (msg != NULL) {
-                msg->msg_ev.uid = LNET_UID_ANY;
-        }
-#endif
         return (msg);
 }
 
@@ -509,7 +537,7 @@ lnet_res_lh_invalidate(lnet_libhandle_t *lh)
 {
        /* ALWAYS called with resource lock held */
        /* NB: cookie is still useful, don't reset it */
-       cfs_list_del(&lh->lh_hash_chain);
+       list_del(&lh->lh_hash_chain);
 }
 
 static inline void
@@ -624,41 +652,53 @@ lnet_isrouter(lnet_peer_t *lp)
 }
 
 static inline void
-lnet_ni_addref_locked(lnet_ni_t *ni)
+lnet_ni_addref_locked(lnet_ni_t *ni, int cpt)
 {
-        LASSERT (ni->ni_refcount > 0);
-        ni->ni_refcount++;
+       LASSERT(cpt >= 0 && cpt < LNET_CPT_NUMBER);
+       LASSERT(*ni->ni_refs[cpt] >= 0);
+
+       (*ni->ni_refs[cpt])++;
 }
 
 static inline void
 lnet_ni_addref(lnet_ni_t *ni)
 {
-        LNET_LOCK();
-        lnet_ni_addref_locked(ni);
-        LNET_UNLOCK();
+       lnet_net_lock(0);
+       lnet_ni_addref_locked(ni, 0);
+       lnet_net_unlock(0);
 }
 
 static inline void
-lnet_ni_decref_locked(lnet_ni_t *ni)
+lnet_ni_decref_locked(lnet_ni_t *ni, int cpt)
 {
-        LASSERT (ni->ni_refcount > 0);
-        ni->ni_refcount--;
-        if (ni->ni_refcount == 0)
-                cfs_list_add_tail(&ni->ni_list, &the_lnet.ln_zombie_nis);
+       LASSERT(cpt >= 0 && cpt < LNET_CPT_NUMBER);
+       LASSERT(*ni->ni_refs[cpt] > 0);
+
+       (*ni->ni_refs[cpt])--;
 }
 
 static inline void
 lnet_ni_decref(lnet_ni_t *ni)
 {
-        LNET_LOCK();
-        lnet_ni_decref_locked(ni);
-        LNET_UNLOCK();
+       lnet_net_lock(0);
+       lnet_ni_decref_locked(ni, 0);
+       lnet_net_unlock(0);
 }
 
+void lnet_ni_free(lnet_ni_t *ni);
+
 static inline int
 lnet_nid2peerhash(lnet_nid_t nid)
 {
-       return cfs_hash_long(nid, LNET_PEER_HASH_BITS);
+       return hash_long(nid, LNET_PEER_HASH_BITS);
+}
+
+static inline struct list_head *
+lnet_net2rnethash(__u32 net)
+{
+       return &the_lnet.ln_remote_nets_hash[(LNET_NETNUM(net) +
+               LNET_NETTYP(net)) &
+               ((1U << the_lnet.ln_remote_nets_hbits) - 1)];
 }
 
 extern lnd_t the_lolnd;
@@ -682,43 +722,44 @@ do {                                                                    \
 } while (0)
 #endif
 
-#ifdef CRAY_XT3
-inline static void
-lnet_set_msg_uid(lnet_ni_t *ni, lnet_msg_t *msg, lnet_uid_t uid)
-{
-        LASSERT (msg->msg_ev.uid == LNET_UID_ANY);
-        msg->msg_ev.uid = uid;
-}
-#endif
-
+extern int lnet_cpt_of_nid_locked(lnet_nid_t nid);
 extern int lnet_cpt_of_nid(lnet_nid_t nid);
-extern lnet_ni_t *lnet_nid2ni_locked (lnet_nid_t nid);
-extern lnet_ni_t *lnet_net2ni_locked (__u32 net);
-static inline lnet_ni_t *
-lnet_net2ni (__u32 net)
-{
-        lnet_ni_t *ni;
-
-        LNET_LOCK();
-        ni = lnet_net2ni_locked(net);
-        LNET_UNLOCK();
-
-        return ni;
-}
+extern lnet_ni_t *lnet_nid2ni_locked(lnet_nid_t nid, int cpt);
+extern lnet_ni_t *lnet_net2ni_locked(__u32 net, int cpt);
+extern lnet_ni_t *lnet_net2ni(__u32 net);
 
 int lnet_notify(lnet_ni_t *ni, lnet_nid_t peer, int alive, cfs_time_t when);
 void lnet_notify_locked(lnet_peer_t *lp, int notifylnd, int alive, cfs_time_t when);
-int lnet_add_route(__u32 net, unsigned int hops, lnet_nid_t gateway_nid);
+int lnet_add_route(__u32 net, unsigned int hops, lnet_nid_t gateway_nid,
+                  unsigned int priority);
 int lnet_check_routes(void);
 int lnet_del_route(__u32 net, lnet_nid_t gw_nid);
 void lnet_destroy_routes(void);
 int lnet_get_route(int idx, __u32 *net, __u32 *hops,
-                   lnet_nid_t *gateway, __u32 *alive);
+                  lnet_nid_t *gateway, __u32 *alive, __u32 *priority);
+int lnet_get_net_config(int idx,
+                       __u32 *cpt_count,
+                       __u64 *nid,
+                       int *peer_timeout,
+                       int *peer_tx_credits,
+                       int *peer_rtr_cr,
+                       int *max_tx_credits,
+                       struct lnet_ioctl_net_config *net_config);
+int lnet_get_rtr_pool_cfg(int idx, struct lnet_ioctl_pool_cfg *pool_cfg);
+
 void lnet_proc_init(void);
 void lnet_proc_fini(void);
 int  lnet_rtrpools_alloc(int im_a_router);
-void lnet_rtrpools_free(void);
+void lnet_destroy_rtrbuf(lnet_rtrbuf_t *rb, int npages);
+int  lnet_rtrpools_adjust(int tiny, int small, int large);
+int lnet_rtrpools_enable(void);
+void lnet_rtrpools_disable(void);
+void lnet_rtrpools_free(int keep_pools);
 lnet_remotenet_t *lnet_find_net_locked (__u32 net);
+int lnet_dyn_add_ni(lnet_pid_t requested_pid, char *nets,
+                   __s32 peer_timeout, __s32 peer_cr, __s32 peer_buf_cr,
+                   __s32 credits);
+int lnet_dyn_del_ni(__u32 net);
 
 int lnet_islocalnid(lnet_nid_t nid);
 int lnet_islocalnet(__u32 net);
@@ -728,15 +769,17 @@ void lnet_msg_attach_md(lnet_msg_t *msg, lnet_libmd_t *md,
 void lnet_msg_detach_md(lnet_msg_t *msg, int status);
 void lnet_build_unlink_event(lnet_libmd_t *md, lnet_event_t *ev);
 void lnet_build_msg_event(lnet_msg_t *msg, lnet_event_kind_t ev_type);
-void lnet_msg_commit(lnet_msg_t *msg, int sending);
-void lnet_msg_decommit(lnet_msg_t *msg, int status);
+void lnet_msg_commit(lnet_msg_t *msg, int cpt);
+void lnet_msg_decommit(lnet_msg_t *msg, int cpt, int status);
 
 void lnet_eq_enqueue_event(lnet_eq_t *eq, lnet_event_t *ev);
 void lnet_prep_send(lnet_msg_t *msg, int type, lnet_process_id_t target,
                     unsigned int offset, unsigned int len);
-int lnet_send(lnet_nid_t nid, lnet_msg_t *msg);
+int lnet_send(lnet_nid_t nid, lnet_msg_t *msg, lnet_nid_t rtr_nid);
 void lnet_return_tx_credits_locked(lnet_msg_t *msg);
 void lnet_return_rx_credits_locked(lnet_msg_t *msg);
+void lnet_schedule_blocked_locked(lnet_rtrbufpool_t *rbp);
+void lnet_drop_routed_msgs_locked(struct list_head *list, int cpt);
 
 /* portals functions */
 /* portals attributes */
@@ -771,20 +814,18 @@ lnet_ptl_unsetopt(lnet_portal_t *ptl, int opt)
 }
 
 /* match-table functions */
-cfs_list_t *lnet_mt_match_head(struct lnet_match_table *mtable,
+struct list_head *lnet_mt_match_head(struct lnet_match_table *mtable,
                               lnet_process_id_t id, __u64 mbits);
 struct lnet_match_table *lnet_mt_of_attach(unsigned int index,
                                           lnet_process_id_t id, __u64 mbits,
                                           __u64 ignore_bits,
                                           lnet_ins_pos_t pos);
-struct lnet_match_table *lnet_mt_of_match(unsigned int index,
-                                         lnet_process_id_t id, __u64 mbits);
 int lnet_mt_match_md(struct lnet_match_table *mtable,
                     struct lnet_match_info *info, struct lnet_msg *msg);
 
 /* portals match/attach functions */
 void lnet_ptl_attach_md(lnet_me_t *me, lnet_libmd_t *md,
-                       cfs_list_t *matches, cfs_list_t *drops);
+                       struct list_head *matches, struct list_head *drops);
 void lnet_ptl_detach_md(lnet_me_t *me, lnet_libmd_t *md);
 int lnet_ptl_match_md(struct lnet_match_info *info, struct lnet_msg *msg);
 
@@ -800,11 +841,13 @@ void lnet_recv(lnet_ni_t *ni, void *private, lnet_msg_t *msg, int delayed,
 lnet_msg_t *lnet_create_reply_msg (lnet_ni_t *ni, lnet_msg_t *get_msg);
 void lnet_set_reply_msg_len(lnet_ni_t *ni, lnet_msg_t *msg, unsigned int len);
 void lnet_finalize(lnet_ni_t *ni, lnet_msg_t *msg, int rc);
-void lnet_drop_delayed_msg_list(cfs_list_t *head, char *reason);
-void lnet_recv_delayed_msg_list(cfs_list_t *head);
+void lnet_drop_delayed_msg_list(struct list_head *head, char *reason);
+void lnet_recv_delayed_msg_list(struct list_head *head);
 
-int lnet_msg_container_setup(struct lnet_msg_container *container);
+int lnet_msg_container_setup(struct lnet_msg_container *container, int cpt);
 void lnet_msg_container_cleanup(struct lnet_msg_container *container);
+void lnet_msg_containers_destroy(void);
+int lnet_msg_containers_create(void);
 
 char *lnet_msgtyp2str (int type);
 void lnet_print_hdr (lnet_hdr_t * hdr);
@@ -917,21 +960,27 @@ int lnet_router_checker_start(void);
 void lnet_router_checker_stop(void);
 void lnet_swap_pinginfo(lnet_ping_info_t *info);
 
-int lnet_ping_target_init(void);
-void lnet_ping_target_fini(void);
 int lnet_ping(lnet_process_id_t id, int timeout_ms,
               lnet_process_id_t *ids, int n_ids);
 
-int lnet_parse_ip2nets (char **networksp, char *ip2nets);
-int lnet_parse_routes (char *route_str, int *im_a_router);
-int lnet_parse_networks (cfs_list_t *nilist, char *networks);
-
-int lnet_nid2peer_locked(lnet_peer_t **lpp, lnet_nid_t nid);
-lnet_peer_t *lnet_find_peer_locked (lnet_nid_t nid);
-void lnet_peer_table_cleanup(void);
-void lnet_peer_table_destroy(void);
-int lnet_peer_table_create(void);
+int lnet_parse_ip2nets(char **networksp, char *ip2nets);
+int lnet_parse_routes(char *route_str, int *im_a_router);
+int lnet_parse_networks(struct list_head *nilist, char *networks);
+int lnet_net_unique(__u32 net, struct list_head *nilist);
+
+int lnet_nid2peer_locked(lnet_peer_t **lpp, lnet_nid_t nid, int cpt);
+lnet_peer_t *lnet_find_peer_locked(struct lnet_peer_table *ptable,
+                                  lnet_nid_t nid);
+void lnet_peer_tables_cleanup(lnet_ni_t *ni);
+void lnet_peer_tables_destroy(void);
+int lnet_peer_tables_create(void);
 void lnet_debug_peer(lnet_nid_t nid);
+int lnet_get_peer_info(__u32 peer_index, __u64 *nid,
+                      char alivness[LNET_MAX_STR_LEN],
+                      __u32 *cpt_iter, __u32 *refcount,
+                      __u32 *ni_peer_tx_credits, __u32 *peer_tx_credits,
+                      __u32 *peer_rtr_credits, __u32 *peer_min_rtr_credtis,
+                      __u32 *peer_tx_qnob);
 
 #ifndef __KERNEL__
 static inline int