Whamcloud - gitweb
LU-6875 update: set st to NULL in error handler
[fs/lustre-release.git] / lnet / lnet / peer.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2012, 2014, Intel Corporation.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lnet/lnet/peer.c
37  */
38
39 #define DEBUG_SUBSYSTEM S_LNET
40
41 #include <lnet/lib-lnet.h>
42 #include <lnet/lib-dlc.h>
43
44 int
45 lnet_peer_tables_create(void)
46 {
47         struct lnet_peer_table  *ptable;
48         struct list_head        *hash;
49         int                     i;
50         int                     j;
51
52         the_lnet.ln_peer_tables = cfs_percpt_alloc(lnet_cpt_table(),
53                                                    sizeof(*ptable));
54         if (the_lnet.ln_peer_tables == NULL) {
55                 CERROR("Failed to allocate cpu-partition peer tables\n");
56                 return -ENOMEM;
57         }
58
59         cfs_percpt_for_each(ptable, i, the_lnet.ln_peer_tables) {
60                 INIT_LIST_HEAD(&ptable->pt_deathrow);
61
62                 LIBCFS_CPT_ALLOC(hash, lnet_cpt_table(), i,
63                                  LNET_PEER_HASH_SIZE * sizeof(*hash));
64                 if (hash == NULL) {
65                         CERROR("Failed to create peer hash table\n");
66                         lnet_peer_tables_destroy();
67                         return -ENOMEM;
68                 }
69
70                 for (j = 0; j < LNET_PEER_HASH_SIZE; j++)
71                         INIT_LIST_HEAD(&hash[j]);
72                 ptable->pt_hash = hash; /* sign of initialization */
73         }
74
75         return 0;
76 }
77
78 void
79 lnet_peer_tables_destroy(void)
80 {
81         struct lnet_peer_table  *ptable;
82         struct list_head        *hash;
83         int                     i;
84         int                     j;
85
86         if (the_lnet.ln_peer_tables == NULL)
87                 return;
88
89         cfs_percpt_for_each(ptable, i, the_lnet.ln_peer_tables) {
90                 hash = ptable->pt_hash;
91                 if (hash == NULL) /* not intialized */
92                         break;
93
94                 LASSERT(list_empty(&ptable->pt_deathrow));
95
96                 ptable->pt_hash = NULL;
97                 for (j = 0; j < LNET_PEER_HASH_SIZE; j++)
98                         LASSERT(list_empty(&hash[j]));
99
100                 LIBCFS_FREE(hash, LNET_PEER_HASH_SIZE * sizeof(*hash));
101         }
102
103         cfs_percpt_free(the_lnet.ln_peer_tables);
104         the_lnet.ln_peer_tables = NULL;
105 }
106
107 static void
108 lnet_peer_table_cleanup_locked(lnet_ni_t *ni, struct lnet_peer_table *ptable)
109 {
110         int              i;
111         lnet_peer_t     *lp;
112         lnet_peer_t     *tmp;
113
114         for (i = 0; i < LNET_PEER_HASH_SIZE; i++) {
115                 list_for_each_entry_safe(lp, tmp, &ptable->pt_hash[i],
116                                          lp_hashlist) {
117                         if (ni != NULL && ni != lp->lp_ni)
118                                 continue;
119                         list_del_init(&lp->lp_hashlist);
120                         /* Lose hash table's ref */
121                         ptable->pt_zombies++;
122                         lnet_peer_decref_locked(lp);
123                 }
124         }
125 }
126
127 static void
128 lnet_peer_table_deathrow_wait_locked(struct lnet_peer_table *ptable,
129                                      int cpt_locked)
130 {
131         int     i;
132
133         for (i = 3; ptable->pt_zombies != 0; i++) {
134                 lnet_net_unlock(cpt_locked);
135
136                 if (IS_PO2(i)) {
137                         CDEBUG(D_WARNING,
138                                "Waiting for %d zombies on peer table\n",
139                                ptable->pt_zombies);
140                 }
141                 set_current_state(TASK_UNINTERRUPTIBLE);
142                 schedule_timeout(cfs_time_seconds(1) >> 1);
143                 lnet_net_lock(cpt_locked);
144         }
145 }
146
147 static void
148 lnet_peer_table_del_rtrs_locked(lnet_ni_t *ni, struct lnet_peer_table *ptable,
149                                 int cpt_locked)
150 {
151         lnet_peer_t     *lp;
152         lnet_peer_t     *tmp;
153         lnet_nid_t       lp_nid;
154         int              i;
155
156         for (i = 0; i < LNET_PEER_HASH_SIZE; i++) {
157                 list_for_each_entry_safe(lp, tmp, &ptable->pt_hash[i],
158                                          lp_hashlist) {
159                         if (ni != lp->lp_ni)
160                                 continue;
161
162                         if (lp->lp_rtr_refcount == 0)
163                                 continue;
164
165                         lp_nid = lp->lp_nid;
166
167                         lnet_net_unlock(cpt_locked);
168                         lnet_del_route(LNET_NIDNET(LNET_NID_ANY), lp_nid);
169                         lnet_net_lock(cpt_locked);
170                 }
171         }
172 }
173
174 void
175 lnet_peer_tables_cleanup(lnet_ni_t *ni)
176 {
177         int                     i;
178         struct lnet_peer_table  *ptable;
179         lnet_peer_t             *lp;
180         struct list_head        deathrow;
181
182         INIT_LIST_HEAD(&deathrow);
183
184         LASSERT(the_lnet.ln_shutdown || ni != NULL);
185         /* If just deleting the peers for a NI, get rid of any routes these
186          * peers are gateways for. */
187         cfs_percpt_for_each(ptable, i, the_lnet.ln_peer_tables) {
188                 lnet_net_lock(i);
189                 lnet_peer_table_del_rtrs_locked(ni, ptable, i);
190                 lnet_net_unlock(i);
191         }
192
193         /* Start the process of moving the applicable peers to
194          * deathrow. */
195         cfs_percpt_for_each(ptable, i, the_lnet.ln_peer_tables) {
196                 lnet_net_lock(i);
197                 lnet_peer_table_cleanup_locked(ni, ptable);
198                 lnet_net_unlock(i);
199         }
200
201         /* Cleanup all entries on deathrow. */
202         cfs_percpt_for_each(ptable, i, the_lnet.ln_peer_tables) {
203                 lnet_net_lock(i);
204                 lnet_peer_table_deathrow_wait_locked(ptable, i);
205                 list_splice_init(&ptable->pt_deathrow, &deathrow);
206                 lnet_net_unlock(i);
207         }
208
209         while (!list_empty(&deathrow)) {
210                 lp = list_entry(deathrow.next, lnet_peer_t, lp_hashlist);
211                 list_del(&lp->lp_hashlist);
212                 LIBCFS_FREE(lp, sizeof(*lp));
213         }
214 }
215
216 void
217 lnet_destroy_peer_locked(lnet_peer_t *lp)
218 {
219         struct lnet_peer_table *ptable;
220
221         LASSERT(lp->lp_refcount == 0);
222         LASSERT(lp->lp_rtr_refcount == 0);
223         LASSERT(list_empty(&lp->lp_txq));
224         LASSERT(list_empty(&lp->lp_hashlist));
225         LASSERT(lp->lp_txqnob == 0);
226
227         ptable = the_lnet.ln_peer_tables[lp->lp_cpt];
228         LASSERT(ptable->pt_number > 0);
229         ptable->pt_number--;
230
231         lnet_ni_decref_locked(lp->lp_ni, lp->lp_cpt);
232         lp->lp_ni = NULL;
233
234         list_add(&lp->lp_hashlist, &ptable->pt_deathrow);
235         LASSERT(ptable->pt_zombies > 0);
236         ptable->pt_zombies--;
237 }
238
239 lnet_peer_t *
240 lnet_find_peer_locked(struct lnet_peer_table *ptable, lnet_nid_t nid)
241 {
242         struct list_head *peers;
243         lnet_peer_t      *lp;
244
245         LASSERT(!the_lnet.ln_shutdown);
246
247         peers = &ptable->pt_hash[lnet_nid2peerhash(nid)];
248         list_for_each_entry(lp, peers, lp_hashlist) {
249                 if (lp->lp_nid == nid) {
250                         lnet_peer_addref_locked(lp);
251                         return lp;
252                 }
253         }
254
255         return NULL;
256 }
257
258 int
259 lnet_nid2peer_locked(lnet_peer_t **lpp, lnet_nid_t nid, int cpt)
260 {
261         struct lnet_peer_table  *ptable;
262         lnet_peer_t             *lp = NULL;
263         lnet_peer_t             *lp2;
264         int                     cpt2;
265         int                     rc = 0;
266
267         *lpp = NULL;
268         if (the_lnet.ln_shutdown) /* it's shutting down */
269                 return -ESHUTDOWN;
270
271         /* cpt can be LNET_LOCK_EX if it's called from router functions */
272         cpt2 = cpt != LNET_LOCK_EX ? cpt : lnet_cpt_of_nid_locked(nid);
273
274         ptable = the_lnet.ln_peer_tables[cpt2];
275         lp = lnet_find_peer_locked(ptable, nid);
276         if (lp != NULL) {
277                 *lpp = lp;
278                 return 0;
279         }
280
281         if (!list_empty(&ptable->pt_deathrow)) {
282                 lp = list_entry(ptable->pt_deathrow.next,
283                                 lnet_peer_t, lp_hashlist);
284                 list_del(&lp->lp_hashlist);
285         }
286
287         /*
288          * take extra refcount in case another thread has shutdown LNet
289          * and destroyed locks and peer-table before I finish the allocation
290          */
291         ptable->pt_number++;
292         lnet_net_unlock(cpt);
293
294         if (lp != NULL)
295                 memset(lp, 0, sizeof(*lp));
296         else
297                 LIBCFS_CPT_ALLOC(lp, lnet_cpt_table(), cpt2, sizeof(*lp));
298
299         if (lp == NULL) {
300                 rc = -ENOMEM;
301                 lnet_net_lock(cpt);
302                 goto out;
303         }
304
305         INIT_LIST_HEAD(&lp->lp_txq);
306         INIT_LIST_HEAD(&lp->lp_rtrq);
307         INIT_LIST_HEAD(&lp->lp_routes);
308
309         lp->lp_notify = 0;
310         lp->lp_notifylnd = 0;
311         lp->lp_notifying = 0;
312         lp->lp_alive_count = 0;
313         lp->lp_timestamp = 0;
314         lp->lp_alive = !lnet_peers_start_down(); /* 1 bit!! */
315         lp->lp_last_alive = cfs_time_current(); /* assumes alive */
316         lp->lp_last_query = 0; /* haven't asked NI yet */
317         lp->lp_ping_timestamp = 0;
318         lp->lp_ping_feats = LNET_PING_FEAT_INVAL;
319         lp->lp_nid = nid;
320         lp->lp_cpt = cpt2;
321         lp->lp_refcount = 2;    /* 1 for caller; 1 for hash */
322         lp->lp_rtr_refcount = 0;
323
324         lnet_net_lock(cpt);
325
326         if (the_lnet.ln_shutdown) {
327                 rc = -ESHUTDOWN;
328                 goto out;
329         }
330
331         lp2 = lnet_find_peer_locked(ptable, nid);
332         if (lp2 != NULL) {
333                 *lpp = lp2;
334                 goto out;
335         }
336
337         lp->lp_ni = lnet_net2ni_locked(LNET_NIDNET(nid), cpt2);
338         if (lp->lp_ni == NULL) {
339                 rc = -EHOSTUNREACH;
340                 goto out;
341         }
342
343         lp->lp_txcredits    =
344         lp->lp_mintxcredits = lp->lp_ni->ni_peertxcredits;
345         lp->lp_rtrcredits    =
346         lp->lp_minrtrcredits = lnet_peer_buffer_credits(lp->lp_ni);
347
348         list_add_tail(&lp->lp_hashlist,
349                       &ptable->pt_hash[lnet_nid2peerhash(nid)]);
350         ptable->pt_version++;
351         *lpp = lp;
352
353         return 0;
354 out:
355         if (lp != NULL)
356                 list_add(&lp->lp_hashlist, &ptable->pt_deathrow);
357         ptable->pt_number--;
358         return rc;
359 }
360
361 void
362 lnet_debug_peer(lnet_nid_t nid)
363 {
364         char            *aliveness = "NA";
365         lnet_peer_t     *lp;
366         int             rc;
367         int             cpt;
368
369         cpt = lnet_cpt_of_nid(nid);
370         lnet_net_lock(cpt);
371
372         rc = lnet_nid2peer_locked(&lp, nid, cpt);
373         if (rc != 0) {
374                 lnet_net_unlock(cpt);
375                 CDEBUG(D_WARNING, "No peer %s\n", libcfs_nid2str(nid));
376                 return;
377         }
378
379         if (lnet_isrouter(lp) || lnet_peer_aliveness_enabled(lp))
380                 aliveness = lp->lp_alive ? "up" : "down";
381
382         CDEBUG(D_WARNING, "%-24s %4d %5s %5d %5d %5d %5d %5d %ld\n",
383                libcfs_nid2str(lp->lp_nid), lp->lp_refcount,
384                aliveness, lp->lp_ni->ni_peertxcredits,
385                lp->lp_rtrcredits, lp->lp_minrtrcredits,
386                lp->lp_txcredits, lp->lp_mintxcredits, lp->lp_txqnob);
387
388         lnet_peer_decref_locked(lp);
389
390         lnet_net_unlock(cpt);
391 }
392
393 int lnet_get_peer_info(__u32 peer_index, __u64 *nid,
394                        char aliveness[LNET_MAX_STR_LEN],
395                        __u32 *cpt_iter, __u32 *refcount,
396                        __u32 *ni_peer_tx_credits, __u32 *peer_tx_credits,
397                        __u32 *peer_rtr_credits, __u32 *peer_min_rtr_credits,
398                        __u32 *peer_tx_qnob)
399 {
400         struct lnet_peer_table  *peer_table;
401         lnet_peer_t             *lp;
402         int                     j;
403         int                     lncpt;
404         bool                    found = false;
405
406         /* get the number of CPTs */
407         lncpt = cfs_percpt_number(the_lnet.ln_peer_tables);
408
409         /* if the cpt number to be examined is >= the number of cpts in
410          * the system then indicate that there are no more cpts to examin
411          */
412         if (*cpt_iter > lncpt)
413                 return -ENOENT;
414
415         /* get the current table */
416         peer_table = the_lnet.ln_peer_tables[*cpt_iter];
417         /* if the ptable is NULL then there are no more cpts to examine */
418         if (peer_table == NULL)
419                 return -ENOENT;
420
421         lnet_net_lock(*cpt_iter);
422
423         for (j = 0; j < LNET_PEER_HASH_SIZE && !found; j++) {
424                 struct list_head *peers = &peer_table->pt_hash[j];
425
426                 list_for_each_entry(lp, peers, lp_hashlist) {
427                         if (peer_index-- > 0)
428                                 continue;
429
430                         snprintf(aliveness, LNET_MAX_STR_LEN, "NA");
431                         if (lnet_isrouter(lp) ||
432                                 lnet_peer_aliveness_enabled(lp))
433                                 snprintf(aliveness, LNET_MAX_STR_LEN,
434                                          lp->lp_alive ? "up" : "down");
435
436                         *nid = lp->lp_nid;
437                         *refcount = lp->lp_refcount;
438                         *ni_peer_tx_credits = lp->lp_ni->ni_peertxcredits;
439                         *peer_tx_credits = lp->lp_txcredits;
440                         *peer_rtr_credits = lp->lp_rtrcredits;
441                         *peer_min_rtr_credits = lp->lp_mintxcredits;
442                         *peer_tx_qnob = lp->lp_txqnob;
443
444                         found = true;
445                 }
446
447         }
448         lnet_net_unlock(*cpt_iter);
449
450         *cpt_iter = lncpt;
451
452         return found ? 0 : -ENOENT;
453 }