Whamcloud - gitweb
Changelog update
[fs/lustre-release.git] / lustre / utils / obdiolib.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/utils/obdiolib.c
37  *
38  * Author: Eric Barton <eeb@clusterfs.com>
39  */
40
41 #include <stdio.h>
42 #include <stdlib.h>
43 #include <errno.h>
44 #include <string.h>
45 #include <fcntl.h>
46 #include <sys/ioctl.h>
47 #include <sys/types.h>
48 #include <sys/stat.h>
49
50 #include <liblustre.h>
51 #include "obdiolib.h"
52
53 void
54 obdio_iocinit (struct obdio_conn *conn)
55 {
56         memset (&conn->oc_data, 0, sizeof (conn->oc_data));
57         conn->oc_data.ioc_version = OBD_IOCTL_VERSION;
58         conn->oc_data.ioc_dev = conn->oc_device;
59         conn->oc_data.ioc_len = sizeof (conn->oc_data);
60 }
61
62 int
63 obdio_ioctl (struct obdio_conn *conn, int cmd)
64 {
65         char *buf = conn->oc_buffer;
66         int   rc;
67         int   rc2;
68
69         rc = obd_ioctl_pack (&conn->oc_data, &buf, sizeof (conn->oc_buffer));
70         if (rc != 0) {
71                 fprintf(stderr, "%s: obd_ioctl_pack: %d (%s)\n",
72                         __FUNCTION__, rc, strerror(errno));
73                 abort();
74         }
75
76         rc = ioctl (conn->oc_fd, cmd, buf);
77         if (rc != 0)
78                 return (rc);
79
80         rc2 = obd_ioctl_unpack (&conn->oc_data, buf, sizeof (conn->oc_buffer));
81         if (rc2 != 0) {
82                 fprintf(stderr, "%s: obd_ioctl_unpack: %d (%s)\n",
83                         __FUNCTION__, rc2, strerror(errno));
84                 abort ();
85         }
86
87         return (rc);
88 }
89
90 struct obdio_conn *
91 obdio_connect (int device)
92 {
93         struct obdio_conn  *conn;
94
95         conn = malloc (sizeof (*conn));
96         if (conn == NULL) {
97                 fprintf (stderr, "%s: no memory\n", __FUNCTION__);
98                 return (NULL);
99         }
100         memset (conn, 0, sizeof (*conn));
101
102         conn->oc_fd = open ("/dev/obd", O_RDWR);
103         if (conn->oc_fd < 0) {
104                 fprintf(stderr, "%s: Can't open /dev/obd: %s\n",
105                         __FUNCTION__, strerror(errno));
106                 goto failed;
107         }
108
109         conn->oc_device = device;
110         return (conn);
111
112  failed:
113         free (conn);
114         return (NULL);
115 }
116
117 void
118 obdio_disconnect (struct obdio_conn *conn, int flags)
119 {
120         close (conn->oc_fd);
121         /* obdclass will automatically close on last ref */
122         free (conn);
123 }
124
125 int
126 obdio_pread (struct obdio_conn *conn, __u64 oid,
127              void *buffer, __u32 count, __u64 offset)
128 {
129         obdio_iocinit (conn);
130
131         conn->oc_data.ioc_obdo1.o_id = oid;
132         conn->oc_data.ioc_obdo1.o_mode = S_IFREG;
133         conn->oc_data.ioc_obdo1.o_valid =
134                 OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLMODE;
135
136         conn->oc_data.ioc_pbuf2 = buffer;
137         conn->oc_data.ioc_plen2 = count;
138         conn->oc_data.ioc_count = count;
139         conn->oc_data.ioc_offset = offset;
140
141         return (obdio_ioctl (conn, OBD_IOC_BRW_READ));
142 }
143
144 int
145 obdio_pwrite (struct obdio_conn *conn, __u64 oid,
146               void *buffer, __u32 count, __u64 offset)
147 {
148         obdio_iocinit (conn);
149
150         conn->oc_data.ioc_obdo1.o_id = oid;
151         conn->oc_data.ioc_obdo1.o_mode = S_IFREG;
152         conn->oc_data.ioc_obdo1.o_valid =
153                 OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLMODE;
154
155         conn->oc_data.ioc_pbuf2 = buffer;
156         conn->oc_data.ioc_plen2 = count;
157         conn->oc_data.ioc_count = count;
158         conn->oc_data.ioc_offset = offset;
159
160         return (obdio_ioctl (conn, OBD_IOC_BRW_WRITE));
161 }
162
163 int
164 obdio_enqueue (struct obdio_conn *conn, __u64 oid,
165                int mode, __u64 offset, __u32 count,
166                struct lustre_handle *lh)
167 {
168         int   rc;
169
170         obdio_iocinit (conn);
171
172         conn->oc_data.ioc_obdo1.o_id = oid;
173         conn->oc_data.ioc_obdo1.o_mode = S_IFREG;
174         conn->oc_data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLMODE;
175
176         conn->oc_data.ioc_conn1 = mode;
177         conn->oc_data.ioc_count = count;
178         conn->oc_data.ioc_offset = offset;
179
180         rc = obdio_ioctl (conn, ECHO_IOC_ENQUEUE);
181
182         if (rc == 0)
183                 *lh = conn->oc_data.ioc_obdo1.o_handle;
184
185         return (rc);
186 }
187
188 int
189 obdio_cancel (struct obdio_conn *conn, struct lustre_handle *lh)
190 {
191         obdio_iocinit (conn);
192         conn->oc_data.ioc_obdo1.o_handle = *lh;
193         conn->oc_data.ioc_obdo1.o_valid = OBD_MD_FLHANDLE;
194
195         return (obdio_ioctl (conn, ECHO_IOC_CANCEL));
196 }
197
198 void *
199 obdio_alloc_aligned_buffer (void **spacep, int size)
200 {
201         int   pagemask = getpagesize() - 1;
202         void *space = malloc(size + pagemask);
203
204         if (space == NULL)
205                 return (NULL);
206
207         *spacep = (void *)(((unsigned long)space + pagemask) & ~pagemask);
208         return space;
209 }
210
211 struct obdio_barrier *
212 obdio_new_barrier (__u64 oid, __u64 id, int npeers)
213 {
214         struct obdio_barrier *b;
215
216         b = malloc(sizeof(*b));
217         if (b == NULL) {
218                 fprintf(stderr, "%s "LPX64": Can't allocate\n",
219                         __FUNCTION__, oid);
220                 return(NULL);
221         }
222
223         b->ob_id = id;
224         b->ob_oid = oid;
225         b->ob_npeers = npeers;
226         b->ob_ordinal = 0;
227         b->ob_count = 0;
228         return (b);
229 }
230
231 int
232 obdio_setup_barrier (struct obdio_conn *conn, struct obdio_barrier *b)
233 {
234         struct lustre_handle    lh;
235         int                     rc;
236         int                     rc2;
237         void                   *space, *fileptr;
238         struct obdio_barrier   *fileb;
239
240         if (b->ob_ordinal != 0 ||
241             b->ob_count != 0) {
242                 fprintf(stderr, "%s: invalid parameter\n", __FUNCTION__);
243                 abort ();
244         }
245
246         space = obdio_alloc_aligned_buffer(&fileptr, getpagesize());
247         if (space == NULL) {
248                 fprintf(stderr, "%s "LPX64": Can't allocate page buffer\n",
249                         __FUNCTION__, b->ob_oid);
250                 return (-1);
251         }
252
253         fileb = fileptr;
254         memset(fileb, 0, getpagesize());
255         *fileb = *b;
256
257         rc = obdio_enqueue(conn, b->ob_oid, LCK_PW, 0, getpagesize(), &lh);
258         if (rc != 0) {
259                 fprintf(stderr, "%s "LPX64": Error on enqueue: %s\n",
260                         __FUNCTION__, b->ob_oid, strerror(errno));
261                 goto out;
262         }
263
264         rc = obdio_pwrite(conn, b->ob_oid, fileb, getpagesize(), 0);
265         if (rc != 0)
266                 fprintf(stderr, "%s "LPX64": Error on write: %s\n",
267                         __FUNCTION__, b->ob_oid, strerror(errno));
268
269         rc2 = obdio_cancel (conn, &lh);
270         if (rc == 0 && rc2 != 0) {
271                 fprintf(stderr, "%s "LPX64": Error on cancel: %s\n",
272                         __FUNCTION__, b->ob_oid, strerror(errno));
273                 rc = rc2;
274         }
275  out:
276         free (space);
277         return (rc);
278 }
279
280 int
281 obdio_barrier (struct obdio_conn *conn, struct obdio_barrier *b)
282 {
283         struct lustre_handle   lh;
284         int                    rc;
285         int                    rc2;
286         void                  *space, *fileptr;
287         struct obdio_barrier  *fileb;
288         char                  *mode;
289
290         space = obdio_alloc_aligned_buffer(&fileptr, getpagesize());
291         if (space == NULL) {
292                 fprintf(stderr, "%s "LPX64": Can't allocate page buffer\n",
293                         __FUNCTION__, b->ob_oid);
294                 return (-1);
295         }
296
297         rc = obdio_enqueue(conn, b->ob_oid, LCK_PW, 0, getpagesize(), &lh);
298         if (rc != 0) {
299                 fprintf(stderr, "%s "LPX64": Error on PW enqueue: %s\n",
300                         __FUNCTION__, b->ob_oid, strerror(errno));
301                 goto out_1;
302         }
303
304         fileb = fileptr;
305         memset(fileb, 0xeb, getpagesize());
306         rc = obdio_pread(conn, b->ob_oid, fileb, getpagesize(), 0);
307         if (rc != 0) {
308                 fprintf(stderr, "%s "LPX64": Error on initial read: %s\n",
309                         __FUNCTION__, b->ob_oid, strerror(errno));
310                 goto out_2;
311         }
312
313         if (fileb->ob_id != b->ob_id ||
314             fileb->ob_oid != b->ob_oid ||
315             fileb->ob_npeers != b->ob_npeers ||
316             fileb->ob_count >= b->ob_npeers ||
317             fileb->ob_ordinal != b->ob_ordinal) {
318                 fprintf(stderr, "%s "LPX64": corrupt on initial read\n",
319                         __FUNCTION__, b->ob_id);
320                 fprintf(stderr,
321                         "  got ["LPX64","LPX64","LPX64","LPX64","LPX64"]\n",
322                         fileb->ob_id, fileb->ob_oid, fileb->ob_npeers,
323                         fileb->ob_ordinal, fileb->ob_count);
324                 fprintf(stderr,
325                        "  expected ["LPX64","LPX64","LPX64","LPX64","LPX64"]\n",
326                         b->ob_id, b->ob_oid, b->ob_npeers,
327                         b->ob_ordinal, b->ob_count);
328                 rc = -1;
329                 goto out_2;
330         }
331
332         fileb->ob_count++;
333         if (fileb->ob_count == fileb->ob_npeers) { /* I'm the last joiner */
334                 fileb->ob_count = 0;       /* join count for next barrier */
335                 fileb->ob_ordinal++;                 /* signal all joined */
336         }
337
338         rc = obdio_pwrite(conn, b->ob_oid, fileb, getpagesize(), 0);
339         if (rc != 0) {
340                 fprintf (stderr, "%s "LPX64": Error on initial write: %s\n",
341                          __FUNCTION__, b->ob_oid, strerror(errno));
342                 goto out_2;
343         }
344
345         mode = "PW";
346         b->ob_ordinal++;           /* now I wait... */
347         while (fileb->ob_ordinal != b->ob_ordinal) {
348                 rc = obdio_cancel (conn, &lh);
349                 if (rc != 0) {
350                         fprintf(stderr, "%s "LPX64": Error on %s cancel: %s\n",
351                                 __FUNCTION__, b->ob_oid, mode, strerror(errno));
352                         goto out_1;
353                 }
354
355                 mode = "PR";
356                 rc = obdio_enqueue(conn, b->ob_oid, LCK_PR,0,getpagesize(),&lh);
357                 if (rc != 0) {
358                         fprintf(stderr, "%s "LPX64": Error on PR enqueue: %s\n",
359                                 __FUNCTION__, b->ob_oid, strerror(errno));
360                         goto out_1;
361                 }
362
363                 memset (fileb, 0xeb, getpagesize());
364                 rc = obdio_pread(conn, b->ob_oid, fileb, getpagesize(), 0);
365                 if (rc != 0) {
366                         fprintf(stderr, "%s "LPX64": Error on read: %s\n",
367                                 __FUNCTION__, b->ob_oid, strerror(errno));
368                         goto out_2;
369                 }
370
371                 if (fileb->ob_id != b->ob_id ||
372                     fileb->ob_oid != b->ob_oid ||
373                     fileb->ob_npeers != b->ob_npeers ||
374                     fileb->ob_count >= b->ob_npeers ||
375                     (fileb->ob_ordinal != b->ob_ordinal - 1 &&
376                      fileb->ob_ordinal != b->ob_ordinal)) {
377                         fprintf(stderr, "%s "LPX64": corrupt\n",
378                                 __FUNCTION__, b->ob_id);
379                         fprintf(stderr, "  got ["LPX64","LPX64","LPX64","
380                                 LPX64","LPX64"]\n",
381                                 fileb->ob_id, fileb->ob_oid, fileb->ob_npeers,
382                                 fileb->ob_ordinal, fileb->ob_count);
383                         fprintf(stderr, "  expected ["LPX64","LPX64","LPX64
384                                 ","LPX64","LPX64"]\n",
385                                 b->ob_id, b->ob_oid, b->ob_npeers,
386                                 b->ob_ordinal, b->ob_count);
387                         rc = -1;
388                         goto out_2;
389                 }
390         }
391
392  out_2:
393         rc2 = obdio_cancel (conn, &lh);
394         if (rc == 0 && rc2 != 0) {
395                 fprintf(stderr, "%s "LPX64": Error on cancel: %s\n",
396                         __FUNCTION__, b->ob_oid, strerror(errno));
397                 rc = rc2;
398         }
399  out_1:
400         free (space);
401         return (rc);
402 }