Whamcloud - gitweb
LU-9120 lnet: set retry count from lnetctl
[fs/lustre-release.git] / lnet / utils / lnetconfig / liblnetconfig.h
1 /*
2  * LGPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU Lesser General Public License as
8  * published by the Free Software Foundation; either version 2.1 of the
9  * License, or (at your option) any later version.
10  *
11  * This library is distributed in the hope that it will be useful, but
12  * WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with this library. If not, see <http://www.gnu.org/licenses/>.
18  *
19  * LGPL HEADER END
20  *
21  * Copyright (c) 2014, 2017, Intel Corporation.
22  *
23  * Author:
24  *   Amir Shehata <amir.shehata@intel.com>
25  */
26
27 #ifndef LIB_LNET_CONFIG_API_H
28 #define LIB_LNET_CONFIG_API_H
29
30 #include <net/if.h>
31 #include <libcfs/util/string.h>
32 #include <linux/lnet/lnet-dlc.h>
33 #include <linux/lnet/nidstr.h>
34
35 #define LUSTRE_CFG_RC_NO_ERR                     0
36 #define LUSTRE_CFG_RC_BAD_PARAM                 -1
37 #define LUSTRE_CFG_RC_MISSING_PARAM             -2
38 #define LUSTRE_CFG_RC_OUT_OF_RANGE_PARAM        -3
39 #define LUSTRE_CFG_RC_OUT_OF_MEM                -4
40 #define LUSTRE_CFG_RC_GENERIC_ERR               -5
41 #define LUSTRE_CFG_RC_NO_MATCH                  -6
42 #define LUSTRE_CFG_RC_MATCH                     -7
43 #define LUSTRE_CFG_RC_SKIP                      -8
44 #define LUSTRE_CFG_RC_LAST_ELEM                 -9
45
46 struct lnet_dlc_network_descr {
47         struct list_head network_on_rule;
48         __u32 nw_id;
49         struct list_head nw_intflist;
50 };
51
52 struct lnet_dlc_intf_descr {
53         struct list_head intf_on_network;
54         char intf_name[IFNAMSIZ];
55         struct cfs_expr_list *cpt_expr;
56 };
57
58 /* forward declaration of the cYAML structure. */
59 struct cYAML;
60
61 /*
62  * lustre_lnet_config_lib_init()
63  *   Initialize the Library to enable communication with the LNET kernel
64  *   module.  Returns the device ID or -EINVAL if there is an error
65  */
66 int lustre_lnet_config_lib_init();
67
68 /*
69  * lustre_lnet_config_lib_uninit
70  *      Uninitialize the DLC Library
71  */
72 void lustre_lnet_config_lib_uninit();
73
74 /*
75  * lustre_lnet_config_ni_system
76  *   Initialize/Uninitialize the lnet NI system.
77  *
78  *   up - whehter to init or uninit the system
79  *   load_ni_from_mod - load NI from mod params.
80  *   seq_no - sequence number of the request
81  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by
82  *            caller
83  */
84 int lustre_lnet_config_ni_system(bool up, bool load_ni_from_mod,
85                                  int seq_no, struct cYAML **err_rc);
86
87 /*
88  * lustre_lnet_config_route
89  *   Send down an IOCTL to the kernel to configure the route
90  *
91  *   nw - network
92  *   gw - gateway
93  *   hops - number of hops passed down by the user
94  *   prio - priority of the route
95  *   seq_no - sequence number of the request
96  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
97  */
98 int lustre_lnet_config_route(char *nw, char *gw, int hops, int prio,
99                              int seq_no, struct cYAML **err_rc);
100
101 /*
102  * lustre_lnet_del_route
103  *   Send down an IOCTL to the kernel to delete a route
104  *
105  *   nw - network
106  *   gw - gateway
107  *   seq_no - sequence number of the request
108  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
109  */
110 int lustre_lnet_del_route(char *nw, char *gw, int seq_no,
111                           struct cYAML **err_rc);
112
113 /*
114  * lustre_lnet_show_route
115  *   Send down an IOCTL to the kernel to show routes
116  *   This function will get one route at a time and filter according to
117  *   provided parameters. If no routes are available then it will dump all
118  *   routes that are in the system.
119  *
120  *   nw - network.  Optional.  Used to filter output
121  *   gw - gateway. Optional. Used to filter ouptut
122  *   hops - number of hops passed down by the user
123  *          Optional.  Used to filter output.
124  *   prio - priority of the route.  Optional.  Used to filter output.
125  *   detail - flag to indicate whether detail output is required
126  *   seq_no - sequence number of the request
127  *   show_rc - [OUT] The show output in YAML.  Must be freed by caller.
128  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
129  *   backup - true to output only what's necessary for reconfiguring
130  *            a node.
131  */
132 int lustre_lnet_show_route(char *nw, char *gw,
133                            int hops, int prio, int detail,
134                            int seq_no, struct cYAML **show_rc,
135                            struct cYAML **err_rc, bool backup);
136
137 /*
138  * lustre_lnet_config_ni
139  *   Send down an IOCTL to configure a network interface. It implicitly
140  *   creates a network if one doesn't exist..
141  *
142  *   nw_descr - network and interface descriptor
143  *   global_cpts - globally defined CPTs
144  *   ip2net - this parameter allows configuring multiple networks.
145  *      it takes precedence over the net and intf parameters
146  *   tunables - LND tunables
147  *   seq_no - sequence number of the request
148  *   lnd_tunables - lnet specific tunable parameters
149  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
150  */
151 int lustre_lnet_config_ni(struct lnet_dlc_network_descr *nw_descr,
152                           struct cfs_expr_list *global_cpts,
153                           char *ip2net,
154                           struct lnet_ioctl_config_lnd_tunables *tunables,
155                           int seq_no, struct cYAML **err_rc);
156
157 /*
158  * lustre_lnet_del_ni
159  *   Send down an IOCTL to delete a network interface. It implicitly
160  *   deletes a network if it becomes empty of nis
161  *
162  *   nw  - network and interface list
163  *   seq_no - sequence number of the request
164  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
165  */
166 int lustre_lnet_del_ni(struct lnet_dlc_network_descr *nw,
167                        int seq_no, struct cYAML **err_rc);
168
169 /*
170  * lustre_lnet_show_net
171  *   Send down an IOCTL to show networks.
172  *   This function will use the nw paramter to filter the output.  If it's
173  *   not provided then all networks are listed.
174  *
175  *   nw - network to show.  Optional.  Used to filter output.
176  *   detail - flag to indicate if we require detail output.
177  *   seq_no - sequence number of the request
178  *   show_rc - [OUT] The show output in YAML.  Must be freed by caller.
179  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
180  *   backup - true to output only what's necessary for reconfiguring
181  *            a node.
182  */
183 int lustre_lnet_show_net(char *nw, int detail, int seq_no,
184                          struct cYAML **show_rc, struct cYAML **err_rc,
185                          bool backup);
186
187 /*
188  * lustre_lnet_enable_routing
189  *   Send down an IOCTL to enable or diable routing
190  *
191  *   enable - 1 to enable routing, 0 to disable routing
192  *   seq_no - sequence number of the request
193  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
194  */
195 int lustre_lnet_enable_routing(int enable, int seq_no,
196                                struct cYAML **err_rc);
197
198 /*
199  * lustre_lnet_config_numa_range
200  *   Set the NUMA range which impacts the NIs to be selected
201  *   during sending. If the NUMA range is large the NUMA
202  *   distance between the message memory and the NI becomes
203  *   less significant. The NUMA range is a relative number
204  *   with no other meaning besides allowing a wider breadth
205  *   for picking an NI to send from.
206  *
207  *   range - numa range value.
208  *   seq_no - sequence number of the request
209  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by
210  *   caller
211  */
212 int lustre_lnet_config_numa_range(int range, int seq_no,
213                                   struct cYAML **err_rc);
214
215 /*
216  * lustre_lnet_show_num_range
217  *   Get the currently set NUMA range
218  *
219  *   seq_no - sequence number of the request
220  *   show_rc - [OUT] struct cYAML tree containing NUMA range info
221  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by
222  *   caller
223  */
224 int lustre_lnet_show_numa_range(int seq_no, struct cYAML **show_rc,
225                                 struct cYAML **err_rc);
226
227 /*
228  * lustre_lnet_config_retry_count
229  *   sets the maximum number of retries to resend a message
230  *
231  *   count - maximum value to configure
232  *   seq_no - sequence number of the request
233  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by
234  *   caller
235  */
236 int lustre_lnet_config_retry_count(int count, int seq_no, struct cYAML **err_rc);
237
238 /*
239  * lustre_lnet_show_retry_count
240  *    show current maximum number of retries in the system
241  *
242  *   seq_no - sequence number of the request
243  *   show_rc - [OUT] struct cYAML tree containing retry count info
244  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by
245  *   caller
246  */
247 int lustre_lnet_show_retry_count(int seq_no, struct cYAML **show_rc,
248                                  struct cYAML **err_rc);
249
250 /*
251  * lustre_lnet_config_max_intf
252  *   Sets the maximum number of interfaces per node. this tunable is
253  *   primarily useful for sanity checks prior to allocating memory.
254  *
255  *   max - maximum value to configure
256  *   seq_no - sequence number of the request
257  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by
258  *   caller
259  */
260 int lustre_lnet_config_max_intf(int max, int seq_no, struct cYAML **err_rc);
261
262 /*
263  * lustre_lnet_show_max_intf
264  *    show current maximum interface setting
265  *
266  *   seq_no - sequence number of the request
267  *   show_rc - [OUT] struct cYAML tree containing NUMA range info
268  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by
269  *   caller
270  */
271 int lustre_lnet_show_max_intf(int seq_no, struct cYAML **show_rc,
272                               struct cYAML **err_rc);
273
274 /*
275  * lustre_lnet_config_discovery
276  *   Enable or disable peer discovery. Peer discovery is enabled by default.
277  *
278  *   enable - non-0 enables, 0 disables
279  *   seq_no - sequence number of the request
280  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by
281  *   caller
282  */
283 int lustre_lnet_config_discovery(int enable, int seq_no, struct cYAML **err_rc);
284
285 /*
286  * lustre_lnet_show_discovery
287  *    show current peer discovery setting
288  *
289  *   seq_no - sequence number of the request
290  *   show_rc - [OUT] struct cYAML tree containing NUMA range info
291  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by
292  *   caller
293  */
294 int lustre_lnet_show_discovery(int seq_no, struct cYAML **show_rc,
295                                struct cYAML **err_rc);
296
297 /*
298  * lustre_lnet_config_buffers
299  *   Send down an IOCTL to configure routing buffer sizes.  A value of 0 means
300  *   default that particular buffer to default size. A value of -1 means
301  *   leave the value of the buffer un changed.
302  *
303  *   tiny - tiny buffers
304  *   small - small buffers
305  *   large - large buffers.
306  *   seq_no - sequence number of the request
307  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
308  */
309 int lustre_lnet_config_buffers(int tiny, int small, int large,
310                                int seq_no, struct cYAML **err_rc);
311
312 /*
313  * lustre_lnet_show_routing
314  *   Send down an IOCTL to dump buffers and routing status
315  *   This function is used to dump buffers for all CPU partitions.
316  *
317  *   seq_no - sequence number of the request
318  *   show_rc - [OUT] The show output in YAML.  Must be freed by caller.
319  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
320  *   backup - true to output only what's necessary for reconfiguring
321  *            a node.
322  */
323 int lustre_lnet_show_routing(int seq_no, struct cYAML **show_rc,
324                              struct cYAML **err_rc, bool backup);
325
326 /*
327  * lustre_lnet_show_stats
328  *   Shows internal LNET statistics.  This is useful to display the
329  *   current LNET activity, such as number of messages route, etc
330  *
331  *     seq_no - sequence number of the command
332  *     show_rc - YAML structure of the resultant show
333  *     err_rc - YAML strucutre of the resultant return code.
334  */
335 int lustre_lnet_show_stats(int seq_no, struct cYAML **show_rc,
336                            struct cYAML **err_rc);
337
338 /*
339  * lustre_lnet_config_peer_nid
340  *   Add a peer nid to a peer with primary nid pnid. If no pnid is given
341  *   then the first nid in the nid list becomes the primary nid for
342  *   a newly created peer.
343  *   Otherwise if pnid is provided and it's unique then a new peer is
344  *   created with pnid as the primary NID and the nids in the nid list as
345  *   secondary nids.
346  *   If any of the peers nids provided in with exception to the pnid is
347  *   not unique the operation fails. Some peer nids might have already
348  *   been added. It's the role of the caller of this API to remove the
349  *   added NIDs if they wish.
350  *
351  *     pnid - Primary NID of the peer
352  *     nid - list of nids to add
353  *     num_nids - number of nids in the nid array
354  *     mr - true if this peer is MR capable.
355  *     ip2nets - true if a list of nid expressions are given to configure
356  *     multiple peers
357  *     seq_no - sequence number of the command
358  *     err_rc - YAML strucutre of the resultant return code.
359  */
360 int lustre_lnet_config_peer_nid(char *pnid, char **nid, int num_nids,
361                                 bool mr, bool ip2nets, int seq_no,
362                                 struct cYAML **err_rc);
363
364 /*
365  * lustre_lnet_del_peer_nid
366  *  Delete the nids given in the nid list from the peer with primary NID
367  *  pnid. If pnid is NULL or it doesn't identify a peer the operation
368  *  fails and no change happens to the system.
369  *  The operation is aborted on the first NID that fails to be deleted.
370  *
371  *     pnid - Primary NID of the peer
372  *     nid - list of nids to add
373  *     num_nids - number of nids in the nid array
374  *     ip2nets - used to specify a range of nids
375  *     seq_no - sequence number of the command
376  *     err_rc - YAML strucutre of the resultant return code.
377  */
378 int lustre_lnet_del_peer_nid(char *pnid, char **nid, int num_nids,
379                              bool ip2nets, int seq_no, struct cYAML **err_rc);
380
381 /*
382  * lustre_lnet_show_peer
383  *   Show the peer identified by nid, knid. If knid is NULL all
384  *   peers in the system are shown.
385  *
386  *     knid - A NID of the peer
387  *     detail - display detailed information
388  *     seq_no - sequence number of the command
389  *     show_rc - YAML structure of the resultant show
390  *     err_rc - YAML strucutre of the resultant return code.
391  *     backup - true to output only what's necessary for reconfiguring
392  *              a node.
393  *
394  */
395 int lustre_lnet_show_peer(char *knid, int detail, int seq_no,
396                           struct cYAML **show_rc, struct cYAML **err_rc,
397                           bool backup);
398
399 /*
400  * lustre_lnet_list_peer
401  *   List the known peers.
402  *
403  *     seq_no - sequence number of the command
404  *     show_rc - YAML structure of the resultant show
405  *     err_rc - YAML strucutre of the resultant return code.
406  *
407  */
408 int lustre_lnet_list_peer(int seq_no,
409                           struct cYAML **show_rc, struct cYAML **err_rc);
410
411 /* lustre_lnet_ping_nid
412  *   Ping the nid list, pnids.
413  *
414  *    pnids - NID list to ping.
415  *    timeout - timeout(seconds) for ping.
416  *    seq_no - sequence number of the command.
417  *    show_rc - YAML structure of the resultant show.
418  *    err_rc - YAML strucutre of the resultant return code.
419  *
420  */
421 int lustre_lnet_ping_nid(char *pnid, int timeout, int seq_no,
422                         struct cYAML **show_rc, struct cYAML **err_rc);
423
424 /* lustre_lnet_discover_nid
425  *   Discover the nid list, pnids.
426  *
427  *    pnids - NID list to discover.
428  *    force - force discovery.
429  *    seq_no - sequence number of the command.
430  *    show_rc - YAML structure of the resultant show.
431  *    err_rc - YAML strucutre of the resultant return code.
432  *
433  */
434 int lustre_lnet_discover_nid(char *pnid, int force, int seq_no,
435                              struct cYAML **show_rc, struct cYAML **err_rc);
436
437 /*
438  * lustre_yaml_config
439  *   Parses the provided YAML file and then calls the specific APIs
440  *   to configure the entities identified in the file
441  *
442  *   f - YAML file
443  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
444  */
445 int lustre_yaml_config(char *f, struct cYAML **err_rc);
446
447 /*
448  * lustre_yaml_del
449  *   Parses the provided YAML file and then calls the specific APIs
450  *   to delete the entities identified in the file
451  *
452  *   f - YAML file
453  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
454  */
455 int lustre_yaml_del(char *f, struct cYAML **err_rc);
456
457 /*
458  * lustre_yaml_show
459  *   Parses the provided YAML file and then calls the specific APIs
460  *   to show the entities identified in the file
461  *
462  *   f - YAML file
463  *   show_rc - [OUT] The show output in YAML.  Must be freed by caller.
464  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
465  */
466 int lustre_yaml_show(char *f, struct cYAML **show_rc,
467                      struct cYAML **err_rc);
468
469 /*
470  * lustre_yaml_exec
471  *   Parses the provided YAML file and then calls the specific APIs
472  *   to execute the entities identified in the file
473  *
474  *   f - YAML file
475  *   show_rc - [OUT] The show output in YAML.  Must be freed by caller.
476  *   err_rc - [OUT] struct cYAML tree describing the error. Freed by caller
477  */
478 int lustre_yaml_exec(char *f, struct cYAML **show_rc,
479                      struct cYAML **err_rc);
480
481 /*
482  * lustre_lnet_init_nw_descr
483  *      initialize the network descriptor structure for use
484  */
485 void lustre_lnet_init_nw_descr(struct lnet_dlc_network_descr *nw_descr);
486
487 /*
488  * lustre_lnet_parse_interfaces
489  *      prase an interface string and populate descriptor structures
490  *              intf_str - interface string of the format
491  *                      <intf>[<expr>], <intf>[<expr>],..
492  *              nw_descr - network descriptor to populate
493  *              init - True to initialize nw_descr
494  */
495 int lustre_lnet_parse_interfaces(char *intf_str,
496                                  struct lnet_dlc_network_descr *nw_descr);
497
498 /*
499  * lustre_lnet_parse_nids
500  *      Parse a set of nids into a locally allocated array and return the
501  *      pointer of the array to the caller. The caller is responsible for
502  *      freeing the array. If an initial array is provided then copy over
503  *      the contents of that array into the new array and append to it the
504  *      new content.
505  *      The nids can be of the form "nid [,nid, nid, nid]"
506  *              nids: nids string to be parsed
507  *              array: initial array of content
508  *              size: num of elements in the array
509  *              out_array: [OUT] new allocated array.
510  *      Returns size of array
511  *              sets the out_array to NULL on failure.
512  */
513 int lustre_lnet_parse_nids(char *nids, char **array, int size,
514                            char ***out_array);
515
516 #endif /* LIB_LNET_CONFIG_API_H */