Whamcloud - gitweb
LU-6261 gnilnd: Changes for small message rate improvment
[fs/lustre-release.git] / lnet / klnds / gnilnd / gnilnd_aries.h
1 /*
2  * Copyright (C) 2009-2012 Cray, Inc.
3  *
4  * Copyright (c) 2014, Intel Corporation.
5  *
6  *   Author: Nic Henke <nic@cray.com>, James Shimek <jshimek@cray.com>
7  *
8  *   This file is part of Lustre, http://www.lustre.org.
9  *
10  *   Lustre is free software; you can redistribute it and/or
11  *   modify it under the terms of version 2 of the GNU General Public
12  *   License as published by the Free Software Foundation.
13  *
14  *   Lustre is distributed in the hope that it will be useful,
15  *   but WITHOUT ANY WARRANTY; without even the implied warranty of
16  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17  *   GNU General Public License for more details.
18  *
19  *   You should have received a copy of the GNU General Public License
20  *   along with Lustre; if not, write to the Free Software
21  *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
22  *
23  */
24 #ifndef _GNILND_ARIES_H
25 #define _GNILND_ARIES_H
26
27 /* for lnet_ipif_query */
28 #include <lnet/lib-lnet.h>
29
30 #ifndef _GNILND_HSS_OPS_H
31 # error "must include gnilnd_hss_ops.h first"
32 #endif
33
34 /* Set HW related values */
35 #ifdef CONFIG_CRAY_XT
36 #include <aries/aries_timeouts_gpl.h>
37 #else
38 /* from aries_timeouts_gpl.h when building for generic kernel */
39 #define TIMEOUT_SECS(x)         ((uint64_t)(((x) / 1000.0) + 0.5))
40 #ifndef TO_GNILND_timeout
41 #define TO_GNILND_timeout               (60000.000000)
42 #endif /* TO_GNILND_timeout */
43 #endif /* CONFIG_CRAY_XT */
44
45 #define GNILND_BASE_TIMEOUT        TIMEOUT_SECS(TO_GNILND_timeout)
46 #define GNILND_CHECKSUM_DEFAULT    0            /* all off for Aries */
47
48 #if defined(CONFIG_CRAY_COMPUTE)
49 #define GNILND_REVERSE_RDMA        GNILND_REVERSE_PUT
50 #define GNILND_RDMA_DLVR_OPTION    GNI_DLVMODE_PERFORMANCE
51 #else
52 #define GNILND_REVERSE_RDMA        GNILND_REVERSE_GET
53 #define GNILND_RDMA_DLVR_OPTION    GNI_DLVMODE_PERFORMANCE
54 #define GNILND_SCHED_THREADS       7             /* scheduler threads */
55 #endif
56
57 /* Thread-safe kgni implemented in minor ver 45, code rev 0xb9 */
58 #define GNILND_KGNI_TS_MINOR_VER 0x45
59
60 /* plug in our functions for use on the simulator */
61 #if !defined(GNILND_USE_RCA)
62
63 extern kgn_data_t kgnilnd_data;
64
65 #define kgnilnd_hw_hb()              do {} while(0)
66
67 #ifdef CONFIG_CRAY_XT
68
69 /* Aries Sim doesn't have hardcoded tables, so we'll hijack the nic_pe
70  * and decode our address and nic addr from that - the rest are just offsets */
71
72 static inline int
73 kgnilnd_nid_to_nicaddrs(__u32 nid, int numnic, __u32 *nicaddr)
74 {
75         if (numnic > 1) {
76                 CERROR("manual nid2nic translation doesn't support"
77                        "multiple nic addrs (you asked for %d)\n",
78                         numnic);
79                 return -EINVAL;
80         }
81         if (nid < kgnilnd_data.kgn_nid_trans_private) {
82                 CERROR("Request for invalid nid translation %u,"
83                        "minimum "LPU64"\n",
84                        nid, kgnilnd_data.kgn_nid_trans_private);
85                 return -ESRCH;
86         }
87
88         *nicaddr = nid - kgnilnd_data.kgn_nid_trans_private;
89
90         CDEBUG(D_NETTRACE, "Sim nid %d -> nic 0x%x\n", nid, *nicaddr);
91
92         return 1;
93 }
94
95 static inline int
96 kgnilnd_nicaddr_to_nid(__u32 nicaddr, __u32 *nid)
97 {
98         *nid = kgnilnd_data.kgn_nid_trans_private + nicaddr;
99         return 1;
100 }
101
102 /* XXX Nic: This does not support multiple device!!!! */
103 static inline int
104 kgnilnd_setup_nic_translation(__u32 device_id)
105 {
106         char              *if_name = "ipogif0";
107         __u32              ipaddr, netmask, my_nid;
108         int                up, rc;
109
110         LCONSOLE_INFO("using Aries SIM IP info for RCA translation\n");
111
112         rc = lnet_ipif_query(if_name, &up, &ipaddr, &netmask);
113         if (rc != 0) {
114                 CERROR ("can't get IP interface for %s: %d\n", if_name, rc);
115                 return rc;
116         }
117         if (!up) {
118                 CERROR ("IP interface %s is down\n", if_name);
119                 return -ENODEV;
120         }
121
122         my_nid = ((ipaddr >> 8) & 0xFF) + (ipaddr & 0xFF);
123         kgnilnd_data.kgn_nid_trans_private = my_nid - device_id;
124
125         return 0;
126 }
127
128 #else /* CONFIG_CRAY_XT */
129 #include <net/inet_common.h>
130 #include <linux/if_arp.h>
131
132 static inline int
133 kgnilnd_nid_to_nicaddrs(__u32 nid, int numnic, __u32 *nicaddrs)
134 {
135         int rc;
136
137 #define NID_MASK ((1ULL << 18) - 1)
138         mm_segment_t fs;
139         struct arpreq req = {
140                 .arp_dev = "ipogif0",
141         };
142
143         req.arp_pa.sa_family = AF_INET;
144         ((struct sockaddr_in *)&req.arp_pa)->sin_addr.s_addr = htonl(nid);
145
146         fs = get_fs();
147         set_fs(get_ds());
148
149         rc = inet_ioctl(kgnilnd_data.kgn_sock, SIOCGARP, (unsigned long)&req);
150         set_fs(fs);
151
152         if (rc < 0) {
153                 CDEBUG(D_NETERROR, "inet_ioctl returned %d\n", rc);
154                 return 0;
155         }
156
157         /* use the lower 18 bits of the mac address to use as a nid value */
158         *nicaddrs = *(__u32 *)&req.arp_ha.sa_data[2];
159         *nicaddrs = ntohl(*nicaddrs) & NID_MASK;
160
161         CDEBUG(D_NETTRACE, "nid %s -> nic 0x%x\n", libcfs_nid2str(nid),
162                 nicaddrs[0]);
163
164         return 1;
165 }
166
167 static inline int
168 kgnilnd_nicaddr_to_nid(__u32 nicaddr, __u32 *nid)
169 {
170         int rc;
171         mm_segment_t fs;
172         struct ifreq ifr = {
173                 .ifr_name = "ipogif0",
174         };
175
176         struct sockaddr_in* ipaddr = (struct sockaddr_in*)&ifr.ifr_addr;
177
178         fs = get_fs();
179         set_fs(get_ds());
180         rc = inet_ioctl(kgnilnd_data.kgn_sock, SIOCGIFADDR, (unsigned long)&ifr);
181         set_fs(fs);
182
183         if (rc < 0) {
184                 CDEBUG(D_NETERROR, "inet_ioctl returned %d\n", rc);
185                 return 1;
186         }
187
188         CDEBUG(D_NETTRACE, "ipaddr %08x\n", htonl(ipaddr->sin_addr.s_addr));
189
190         *nid = htonl(ipaddr->sin_addr.s_addr);
191         CDEBUG(D_NETTRACE, "nic 0x%x -> nid %s\n", nicaddr,
192                 libcfs_nid2str(*nid));
193         return 0;
194 }
195
196 static inline int
197 kgnilnd_setup_nic_translation(__u32 device_id)
198 {
199         return 0;
200 }
201
202 #endif /* CONFIG_CRAY_XT */
203
204 #endif /* GNILND_USE_RCA */
205
206 #endif /* _GNILND_ARIES_H */