Whamcloud - gitweb
b=22598 osd thandle usage counters
[fs/lustre-release.git] / libcfs / libcfs / kernel_user_comm.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright (c) 2010, Oracle and/or its affiliates. All rights reserved.
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * Author: Nathan Rutman <nathan.rutman@sun.com>
37  *
38  * Kernel <-> userspace communication routines.
39  * Using pipes for all arches.
40  */
41
42 #define DEBUG_SUBSYSTEM S_CLASS
43 #define D_KUC 0
44
45 #include <libcfs/libcfs.h>
46
47 #ifdef LUSTRE_UTILS
48 /* This is the userspace side. */
49
50 /** Start the userspace side of a KUC pipe.
51  * @param link Private descriptor for pipe/socket.
52  * @param groups KUC broadcast group to listen to
53  *          (can be null for unicast to this pid)
54  */
55 int libcfs_ukuc_start(lustre_kernelcomm *link, int group)
56 {
57         int pfd[2];
58
59         if (pipe(pfd) < 0)
60                 return -errno;
61
62         memset(link, 0, sizeof(*link));
63         link->lk_rfd = pfd[0];
64         link->lk_wfd = pfd[1];
65         link->lk_group = group;
66         link->lk_uid = getpid();
67         return 0;
68 }
69
70 int libcfs_ukuc_stop(lustre_kernelcomm *link)
71 {
72         if (link->lk_wfd > 0)
73                 close(link->lk_wfd);
74         return close(link->lk_rfd);
75 }
76
77 #define lhsz sizeof(*kuch)
78
79 /** Read a message from the link.
80  * Allocates memory, returns handle
81  *
82  * @param link Private descriptor for pipe/socket.
83  * @param buf Buffer to read into, must include size for kuc_hdr
84  * @param maxsize Maximum message size allowed
85  * @param transport Only listen to messages on this transport
86  *      (and the generic transport)
87  */
88 int libcfs_ukuc_msg_get(lustre_kernelcomm *link, char *buf, int maxsize,
89                         int transport)
90 {
91         struct kuc_hdr *kuch;
92         int rc = 0;
93
94         memset(buf, 0, maxsize);
95
96         CDEBUG(D_KUC, "Waiting for message from kernel on fd %d\n",
97                link->lk_rfd);
98
99         while (1) {
100                 /* Read header first to get message size */
101                 rc = read(link->lk_rfd, buf, lhsz);
102                 if (rc <= 0) {
103                         rc = -errno;
104                         break;
105                 }
106                 kuch = (struct kuc_hdr *)buf;
107
108                 CDEBUG(D_KUC, " Received message mg=%x t=%d m=%d l=%d\n",
109                        kuch->kuc_magic, kuch->kuc_transport, kuch->kuc_msgtype,
110                        kuch->kuc_msglen);
111
112                 if (kuch->kuc_magic != KUC_MAGIC) {
113                         CERROR("bad message magic %x != %x\n",
114                                kuch->kuc_magic, KUC_MAGIC);
115                         rc = -EPROTO;
116                         break;
117                 }
118
119                 if (kuch->kuc_msglen > maxsize) {
120                         rc = -EMSGSIZE;
121                         break;
122                 }
123
124                 /* Read payload */
125                 rc = read(link->lk_rfd, buf + lhsz, kuch->kuc_msglen - lhsz);
126                 if (rc < 0) {
127                         rc = -errno;
128                         break;
129                 }
130                 if (rc < (kuch->kuc_msglen - lhsz)) {
131                         CERROR("short read: got %d of %d bytes\n",
132                                rc, kuch->kuc_msglen);
133                         rc = -EPROTO;
134                         break;
135                 }
136
137                 if (kuch->kuc_transport == transport ||
138                     kuch->kuc_transport == KUC_TRANSPORT_GENERIC) {
139                         return 0;
140                 }
141                 /* Drop messages for other transports */
142         }
143         return rc;
144 }
145
146 #else /* LUSTRE_UTILS */
147 /* This is the kernel side (liblustre as well). */
148
149 /**
150  * libcfs_kkuc_msg_put - send an message from kernel to userspace
151  * @param fp to send the message to
152  * @param payload Payload data.  First field of payload is always
153  *   struct kuc_hdr
154  */
155 int libcfs_kkuc_msg_put(cfs_file_t *filp, void *payload)
156 {
157         struct kuc_hdr *kuch = (struct kuc_hdr *)payload;
158         int rc = -ENOSYS;
159
160         if (filp == NULL || IS_ERR(filp))
161                 return -EBADF;
162
163         if (kuch->kuc_magic != KUC_MAGIC) {
164                 CERROR("KernelComm: bad magic %x\n", kuch->kuc_magic);
165                 return -ENOSYS;
166         }
167
168 #ifdef __KERNEL__
169         {
170                 loff_t offset = 0;
171                 rc = cfs_user_write(filp, (char *)payload, kuch->kuc_msglen,
172                                     &offset);
173         }
174 #endif
175
176         if (rc < 0)
177                 CWARN("message send failed (%d)\n", rc);
178         else
179                 CDEBUG(D_KUC, "Sent message rc=%d, fp=%p\n", rc, filp);
180
181         return rc;
182 }
183 CFS_EXPORT_SYMBOL(libcfs_kkuc_msg_put);
184
185 /* Broadcast groups are global across all mounted filesystems;
186  * i.e. registering for a group on 1 fs will get messages for that
187  * group from any fs */
188 /** A single group reigstration has a uid and a file pointer */
189 struct kkuc_reg {
190         cfs_list_t  kr_chain;
191         int         kr_uid;
192         cfs_file_t *kr_fp;
193 };
194 static cfs_list_t kkuc_groups[KUC_GRP_MAX+1] = {};
195 /* Protect message sending against remove and adds */
196 static CFS_DECLARE_RWSEM(kg_sem);
197
198 /** Add a receiver to a broadcast group
199  * @param filp pipe to write into
200  * @param uid identidier for this receiver
201  * @param group group number
202  */
203 int libcfs_kkuc_group_add(cfs_file_t *filp, int uid, int group)
204 {
205         struct kkuc_reg *reg;
206
207         if (group > KUC_GRP_MAX) {
208                 CDEBUG(D_WARNING, "Kernelcomm: bad group %d\n", group);
209                 return -EINVAL;
210         }
211
212         /* fput in group_rem */
213         if (filp == NULL)
214                 return -EBADF;
215
216         /* freed in group_rem */
217         reg = cfs_alloc(sizeof(*reg), 0);
218         if (reg == NULL)
219                 return -ENOMEM;
220
221         reg->kr_fp = filp;
222         reg->kr_uid = uid;
223
224         cfs_down_write(&kg_sem);
225         if (kkuc_groups[group].next == NULL)
226                 CFS_INIT_LIST_HEAD(&kkuc_groups[group]);
227         cfs_list_add(&reg->kr_chain, &kkuc_groups[group]);
228         cfs_up_write(&kg_sem);
229
230         CDEBUG(D_KUC, "Added uid=%d fp=%p to group %d\n", uid, filp, group);
231
232         return 0;
233 }
234 CFS_EXPORT_SYMBOL(libcfs_kkuc_group_add);
235
236 int libcfs_kkuc_group_rem(int uid, int group)
237 {
238         struct kkuc_reg *reg, *next;
239         ENTRY;
240
241         if (kkuc_groups[group].next == NULL)
242                 RETURN(0);
243
244         if (uid == 0) {
245                 /* Broadcast a shutdown message */
246                 struct kuc_hdr lh;
247
248                 lh.kuc_magic = KUC_MAGIC;
249                 lh.kuc_transport = KUC_TRANSPORT_GENERIC;
250                 lh.kuc_msgtype = KUC_MSG_SHUTDOWN;
251                 lh.kuc_msglen = sizeof(lh);
252                 libcfs_kkuc_group_put(group, &lh);
253         }
254
255         cfs_down_write(&kg_sem);
256         cfs_list_for_each_entry_safe(reg, next, &kkuc_groups[group], kr_chain) {
257                 if ((uid == 0) || (uid == reg->kr_uid)) {
258                         cfs_list_del(&reg->kr_chain);
259                         CDEBUG(D_KUC, "Removed uid=%d fp=%p from group %d\n",
260                                reg->kr_uid, reg->kr_fp, group);
261                         cfs_put_file(reg->kr_fp);
262                         cfs_free(reg);
263                 }
264         }
265         cfs_up_write(&kg_sem);
266
267         RETURN(0);
268 }
269 CFS_EXPORT_SYMBOL(libcfs_kkuc_group_rem);
270
271 int libcfs_kkuc_group_put(int group, void *payload)
272 {
273         struct kkuc_reg *reg;
274         int rc = 0;
275         ENTRY;
276
277         cfs_down_read(&kg_sem);
278         cfs_list_for_each_entry(reg, &kkuc_groups[group], kr_chain) {
279                 rc = libcfs_kkuc_msg_put(reg->kr_fp, payload);
280         }
281         cfs_up_read(&kg_sem);
282
283         RETURN(rc);
284 }
285 CFS_EXPORT_SYMBOL(libcfs_kkuc_group_put);
286
287 #endif /* LUSTRE_UTILS */
288