Whamcloud - gitweb
i=liang,b=15332,b=21103:
[fs/lustre-release.git] / lnet / lnet / peer.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lnet/lnet/peer.c
37  */
38
39 #define DEBUG_SUBSYSTEM S_LNET
40
41 #include <lnet/lib-lnet.h>
42
43 int
44 lnet_create_peer_table(void)
45 {
46         struct list_head *hash;
47         int               i;
48
49         LASSERT (the_lnet.ln_peer_hash == NULL);
50         LIBCFS_ALLOC(hash, LNET_PEER_HASHSIZE * sizeof(struct list_head));
51         
52         if (hash == NULL) {
53                 CERROR("Can't allocate peer hash table\n");
54                 return -ENOMEM;
55         }
56
57         for (i = 0; i < LNET_PEER_HASHSIZE; i++)
58                 CFS_INIT_LIST_HEAD(&hash[i]);
59
60         the_lnet.ln_peer_hash = hash;
61         return 0;
62 }
63
64 void
65 lnet_destroy_peer_table(void)
66 {
67         int         i;
68
69         if (the_lnet.ln_peer_hash == NULL)
70                 return;
71
72         for (i = 0; i < LNET_PEER_HASHSIZE; i++)
73                 LASSERT (list_empty(&the_lnet.ln_peer_hash[i]));
74         
75         LIBCFS_FREE(the_lnet.ln_peer_hash,
76                     LNET_PEER_HASHSIZE * sizeof (struct list_head));
77         the_lnet.ln_peer_hash = NULL;
78 }
79
80 void
81 lnet_clear_peer_table(void)
82 {
83         int         i;
84
85         LASSERT (the_lnet.ln_shutdown);         /* i.e. no new peers */
86         
87         for (i = 0; i < LNET_PEER_HASHSIZE; i++) {
88                 struct list_head *peers = &the_lnet.ln_peer_hash[i];
89
90                 LNET_LOCK();
91                 while (!list_empty(peers)) {
92                         lnet_peer_t *lp = list_entry(peers->next,
93                                                      lnet_peer_t, lp_hashlist);
94                         
95                         list_del(&lp->lp_hashlist);
96                         lnet_peer_decref_locked(lp);   /* lose hash table's ref */
97                 }
98                 LNET_UNLOCK();
99         }
100
101         LNET_LOCK();
102         for (i = 3; the_lnet.ln_npeers != 0;i++) {
103                 LNET_UNLOCK();
104
105                 if ((i & (i-1)) == 0)
106                         CDEBUG(D_WARNING,"Waiting for %d peers\n", 
107                                the_lnet.ln_npeers);
108                 cfs_pause(cfs_time_seconds(1));
109
110                 LNET_LOCK();
111         }
112         LNET_UNLOCK();
113 }
114
115 void
116 lnet_destroy_peer_locked (lnet_peer_t *lp) 
117 {
118         lnet_ni_decref_locked(lp->lp_ni);
119         LNET_UNLOCK();
120
121         LASSERT (lp->lp_refcount == 0);
122         LASSERT (lp->lp_rtr_refcount == 0);
123         LASSERT (list_empty(&lp->lp_txq));
124         LASSERT (lp->lp_txqnob == 0);
125         LASSERT (lp->lp_rcd == NULL);
126
127         LIBCFS_FREE(lp, sizeof(*lp));
128
129         LNET_LOCK();
130
131         LASSERT(the_lnet.ln_npeers > 0);
132         the_lnet.ln_npeers--;
133 }
134
135 lnet_peer_t *
136 lnet_find_peer_locked (lnet_nid_t nid)
137 {
138         unsigned int      idx = LNET_NIDADDR(nid) % LNET_PEER_HASHSIZE;
139         struct list_head *peers = &the_lnet.ln_peer_hash[idx];
140         struct list_head *tmp;
141         lnet_peer_t      *lp;
142
143         if (the_lnet.ln_shutdown)
144                 return NULL;
145
146         list_for_each (tmp, peers) {
147                 lp = list_entry(tmp, lnet_peer_t, lp_hashlist);
148                 
149                 if (lp->lp_nid == nid) {
150                         lnet_peer_addref_locked(lp);
151                         return lp;
152                 }
153         }
154         
155         return NULL;
156 }
157
158 int
159 lnet_nid2peer_locked(lnet_peer_t **lpp, lnet_nid_t nid)
160 {
161         lnet_peer_t    *lp;
162         lnet_peer_t    *lp2;
163
164         lp = lnet_find_peer_locked(nid);
165         if (lp != NULL) {
166                 *lpp = lp;
167                 return 0;
168         }
169         
170         LNET_UNLOCK();
171         
172         LIBCFS_ALLOC(lp, sizeof(*lp));
173         if (lp == NULL) {
174                 *lpp = NULL;
175                 LNET_LOCK();
176                 return -ENOMEM;
177         }
178
179         memset(lp, 0, sizeof(*lp));             /* zero counters etc */
180         
181         CFS_INIT_LIST_HEAD(&lp->lp_txq);
182         CFS_INIT_LIST_HEAD(&lp->lp_rtrq);
183         
184         lp->lp_notify = 0;
185         lp->lp_notifylnd = 0;
186         lp->lp_notifying = 0;
187         lp->lp_alive_count = 0;
188         lp->lp_timestamp = 0;
189         lp->lp_alive = !lnet_peers_start_down(); /* 1 bit!! */
190         lp->lp_last_alive = cfs_time_current(); /* assumes alive */
191         lp->lp_last_query = 0; /* haven't asked NI yet */
192         lp->lp_ping_timestamp = 0;
193         lp->lp_nid = nid;
194         lp->lp_refcount = 2;                    /* 1 for caller; 1 for hash */
195         lp->lp_rtr_refcount = 0;
196
197         LNET_LOCK();
198
199         lp2 = lnet_find_peer_locked(nid);
200         if (lp2 != NULL) {
201                 LNET_UNLOCK();
202                 LIBCFS_FREE(lp, sizeof(*lp));
203                 LNET_LOCK();
204
205                 if (the_lnet.ln_shutdown) {
206                         lnet_peer_decref_locked(lp2);
207                         *lpp = NULL;
208                         return -ESHUTDOWN;
209                 }
210
211                 *lpp = lp2;
212                 return 0;
213         }
214                 
215         lp->lp_ni = lnet_net2ni_locked(LNET_NIDNET(nid));
216         if (lp->lp_ni == NULL) {
217                 LNET_UNLOCK();
218                 LIBCFS_FREE(lp, sizeof(*lp));
219                 LNET_LOCK();
220
221                 *lpp = NULL;
222                 return the_lnet.ln_shutdown ? -ESHUTDOWN : -EHOSTUNREACH;
223         }
224
225         lp->lp_txcredits    =
226         lp->lp_mintxcredits = lp->lp_ni->ni_peertxcredits;
227         lp->lp_rtrcredits    =
228         lp->lp_minrtrcredits = lnet_peer_buffer_credits(lp->lp_ni);
229
230         /* can't add peers after shutdown starts */
231         LASSERT (!the_lnet.ln_shutdown);
232
233         list_add_tail(&lp->lp_hashlist, lnet_nid2peerhash(nid));
234         the_lnet.ln_npeers++;
235         the_lnet.ln_peertable_version++;
236         *lpp = lp;
237         return 0;
238 }
239
240 void
241 lnet_debug_peer(lnet_nid_t nid)
242 {
243         char        *aliveness = "NA";
244         int          rc;
245         lnet_peer_t *lp;
246
247         LNET_LOCK();
248
249         rc = lnet_nid2peer_locked(&lp, nid);
250         if (rc != 0) {
251                 LNET_UNLOCK();
252                 CDEBUG(D_WARNING, "No peer %s\n", libcfs_nid2str(nid));
253                 return;
254         }
255
256         if (lnet_isrouter(lp) || lp->lp_ni->ni_peertimeout > 0)
257                 aliveness = lp->lp_alive ? "up" : "down";
258
259         CDEBUG(D_WARNING, "%-24s %4d %5s %5d %5d %5d %5d %5d %ld\n",
260                libcfs_nid2str(lp->lp_nid), lp->lp_refcount,
261                aliveness, lp->lp_ni->ni_peertxcredits,
262                lp->lp_rtrcredits, lp->lp_minrtrcredits,
263                lp->lp_txcredits, lp->lp_mintxcredits, lp->lp_txqnob);
264
265         lnet_peer_decref_locked(lp);
266
267         LNET_UNLOCK();
268 }