Whamcloud - gitweb
LU-6047 obd: remove client Size on MDS support
[fs/lustre-release.git] / lustre / mdc / mdc_lib.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2014, Intel Corporation.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  */
36
37 #define DEBUG_SUBSYSTEM S_MDC
38 #include <lustre_net.h>
39 #include <lustre/lustre_idl.h>
40 #include <obd_class.h>
41 #include <obd.h>
42 #include <cl_object.h>
43 #include "mdc_internal.h"
44
45
46 static void __mdc_pack_body(struct mdt_body *b, __u32 suppgid)
47 {
48         LASSERT (b != NULL);
49
50         b->mbo_suppgid = suppgid;
51         b->mbo_uid = from_kuid(&init_user_ns, current_uid());
52         b->mbo_gid = from_kgid(&init_user_ns, current_gid());
53         b->mbo_fsuid = from_kuid(&init_user_ns, current_fsuid());
54         b->mbo_fsgid = from_kgid(&init_user_ns, current_fsgid());
55         b->mbo_capability = cfs_curproc_cap_pack();
56 }
57
58 void mdc_pack_capa(struct ptlrpc_request *req, const struct req_msg_field *field,
59                    struct obd_capa *oc)
60 {
61         struct req_capsule *pill = &req->rq_pill;
62         struct lustre_capa *c;
63
64         if (oc == NULL) {
65                 LASSERT(req_capsule_get_size(pill, field, RCL_CLIENT) == 0);
66                 return;
67         }
68
69         c = req_capsule_client_get(pill, field);
70         LASSERT(c != NULL);
71         capa_cpy(c, oc);
72         DEBUG_CAPA(D_SEC, c, "pack");
73 }
74
75 void mdc_swap_layouts_pack(struct ptlrpc_request *req,
76                            struct md_op_data *op_data)
77 {
78         struct mdt_body *b = req_capsule_client_get(&req->rq_pill,
79                                                     &RMF_MDT_BODY);
80
81         __mdc_pack_body(b, op_data->op_suppgids[0]);
82         b->mbo_fid1 = op_data->op_fid1;
83         b->mbo_fid2 = op_data->op_fid2;
84         b->mbo_valid |= OBD_MD_FLID;
85
86         mdc_pack_capa(req, &RMF_CAPA1, op_data->op_capa1);
87         mdc_pack_capa(req, &RMF_CAPA2, op_data->op_capa2);
88 }
89
90 void mdc_pack_body(struct ptlrpc_request *req,
91                    const struct lu_fid *fid, struct obd_capa *oc,
92                    __u64 valid, size_t ea_size, __u32 suppgid, __u32 flags)
93 {
94         struct mdt_body *b = req_capsule_client_get(&req->rq_pill,
95                                                     &RMF_MDT_BODY);
96         LASSERT(b != NULL);
97         b->mbo_valid = valid;
98         b->mbo_eadatasize = ea_size;
99         b->mbo_flags = flags;
100         __mdc_pack_body(b, suppgid);
101         if (fid) {
102                 b->mbo_fid1 = *fid;
103                 b->mbo_valid |= OBD_MD_FLID;
104                 mdc_pack_capa(req, &RMF_CAPA1, oc);
105         }
106 }
107
108 /**
109  * Pack a name (path component) into a request
110  *
111  * \param[in]   req             request
112  * \param[in]   field           request field (usually RMF_NAME)
113  * \param[in]   name            path component
114  * \param[in]   name_len        length of path component
115  *
116  * \a field must be present in \a req and of size \a name_len + 1.
117  *
118  * \a name must be '\0' terminated of length \a name_len and represent
119  * a single path component (not contain '/').
120  */
121 static void mdc_pack_name(struct ptlrpc_request *req,
122                           const struct req_msg_field *field,
123                           const char *name, size_t name_len)
124 {
125         char *buf;
126         size_t buf_size;
127         size_t cpy_len;
128
129         buf = req_capsule_client_get(&req->rq_pill, field);
130         buf_size = req_capsule_get_size(&req->rq_pill, field, RCL_CLIENT);
131
132         LASSERT(name != NULL && name_len != 0 &&
133                 buf != NULL && buf_size == name_len + 1);
134
135         cpy_len = strlcpy(buf, name, buf_size);
136
137         LASSERT(cpy_len == name_len && lu_name_is_valid_2(buf, cpy_len));
138 }
139
140 void mdc_readdir_pack(struct ptlrpc_request *req, __u64 pgoff, size_t size,
141                       const struct lu_fid *fid, struct obd_capa *oc)
142 {
143         struct mdt_body *b = req_capsule_client_get(&req->rq_pill,
144                                                     &RMF_MDT_BODY);
145         b->mbo_fid1 = *fid;
146         b->mbo_valid |= OBD_MD_FLID;
147         b->mbo_size = pgoff;                   /* !! */
148         b->mbo_nlink = size;                    /* !! */
149         __mdc_pack_body(b, -1);
150         b->mbo_mode = LUDA_FID | LUDA_TYPE;
151
152         mdc_pack_capa(req, &RMF_CAPA1, oc);
153 }
154
155 /* packing of MDS records */
156 void mdc_create_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
157                      const void *data, size_t datalen, umode_t mode,
158                      uid_t uid, gid_t gid, cfs_cap_t cap_effective, __u64 rdev)
159 {
160         struct mdt_rec_create   *rec;
161         char                    *tmp;
162         __u64                    flags;
163
164         CLASSERT(sizeof(struct mdt_rec_reint) == sizeof(struct mdt_rec_create));
165         rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
166
167
168         rec->cr_opcode   = REINT_CREATE;
169         rec->cr_fsuid    = uid;
170         rec->cr_fsgid    = gid;
171         rec->cr_cap      = cap_effective;
172         rec->cr_fid1     = op_data->op_fid1;
173         rec->cr_fid2     = op_data->op_fid2;
174         rec->cr_mode     = mode;
175         rec->cr_rdev     = rdev;
176         rec->cr_time     = op_data->op_mod_time;
177         rec->cr_suppgid1 = op_data->op_suppgids[0];
178         rec->cr_suppgid2 = op_data->op_suppgids[1];
179         flags = 0;
180         if (op_data->op_bias & MDS_CREATE_VOLATILE)
181                 flags |= MDS_OPEN_VOLATILE;
182         set_mrc_cr_flags(rec, flags);
183         rec->cr_bias     = op_data->op_bias;
184         rec->cr_umask    = current_umask();
185
186         mdc_pack_capa(req, &RMF_CAPA1, op_data->op_capa1);
187
188         mdc_pack_name(req, &RMF_NAME, op_data->op_name, op_data->op_namelen);
189         if (data) {
190                 tmp = req_capsule_client_get(&req->rq_pill, &RMF_EADATA);
191                 memcpy(tmp, data, datalen);
192         }
193 }
194
195 static inline __u64 mds_pack_open_flags(__u64 flags)
196 {
197         __u64 cr_flags = (flags & (FMODE_READ | FMODE_WRITE |
198                                    MDS_OPEN_FL_INTERNAL));
199
200         if (flags & O_CREAT)
201                 cr_flags |= MDS_OPEN_CREAT;
202         if (flags & O_EXCL)
203                 cr_flags |= MDS_OPEN_EXCL;
204         if (flags & O_TRUNC)
205                 cr_flags |= MDS_OPEN_TRUNC;
206         if (flags & O_APPEND)
207                 cr_flags |= MDS_OPEN_APPEND;
208         if (flags & O_SYNC)
209                 cr_flags |= MDS_OPEN_SYNC;
210         if (flags & O_DIRECTORY)
211                 cr_flags |= MDS_OPEN_DIRECTORY;
212 #ifdef FMODE_EXEC
213         if (flags & FMODE_EXEC)
214                 cr_flags |= MDS_FMODE_EXEC;
215 #endif
216         if (cl_is_lov_delay_create(flags))
217                 cr_flags |= MDS_OPEN_DELAY_CREATE;
218
219         if (flags & O_NONBLOCK)
220                 cr_flags |= MDS_OPEN_NORESTORE;
221
222         return cr_flags;
223 }
224
225 /* packing of MDS records */
226 void mdc_open_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
227                    umode_t mode, __u64 rdev, __u64 flags, const void *lmm,
228                    size_t lmmlen)
229 {
230         struct mdt_rec_create *rec;
231         char *tmp;
232         __u64 cr_flags;
233
234         CLASSERT(sizeof(struct mdt_rec_reint) == sizeof(struct mdt_rec_create));
235         rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
236
237         /* XXX do something about time, uid, gid */
238         rec->cr_opcode = REINT_OPEN;
239         rec->cr_fsuid   = from_kuid(&init_user_ns, current_fsuid());
240         rec->cr_fsgid   = from_kgid(&init_user_ns, current_fsgid());
241         rec->cr_cap    = cfs_curproc_cap_pack();
242         rec->cr_mode   = mode;
243         cr_flags        = mds_pack_open_flags(flags);
244         rec->cr_rdev   = rdev;
245         rec->cr_umask  = current_umask();
246         if (op_data != NULL) {
247                 rec->cr_fid1       = op_data->op_fid1;
248                 rec->cr_fid2       = op_data->op_fid2;
249                 rec->cr_time       = op_data->op_mod_time;
250                 rec->cr_suppgid1   = op_data->op_suppgids[0];
251                 rec->cr_suppgid2   = op_data->op_suppgids[1];
252                 rec->cr_bias       = op_data->op_bias;
253                 rec->cr_old_handle = op_data->op_handle;
254
255                 mdc_pack_capa(req, &RMF_CAPA1, op_data->op_capa1);
256                 /* the next buffer is child capa, which is used for replay,
257                  * will be packed from the data in reply message. */
258
259                 if (op_data->op_name) {
260                         mdc_pack_name(req, &RMF_NAME, op_data->op_name,
261                                       op_data->op_namelen);
262
263                         if (op_data->op_bias & MDS_CREATE_VOLATILE)
264                                 cr_flags |= MDS_OPEN_VOLATILE;
265                 }
266         }
267
268         if (lmm) {
269                 cr_flags |= MDS_OPEN_HAS_EA;
270                 tmp = req_capsule_client_get(&req->rq_pill, &RMF_EADATA);
271                 memcpy(tmp, lmm, lmmlen);
272         }
273         set_mrc_cr_flags(rec, cr_flags);
274 }
275
276 static inline __u64 attr_pack(unsigned int ia_valid) {
277         __u64 sa_valid = 0;
278
279         if (ia_valid & ATTR_MODE)
280                 sa_valid |= MDS_ATTR_MODE;
281         if (ia_valid & ATTR_UID)
282                 sa_valid |= MDS_ATTR_UID;
283         if (ia_valid & ATTR_GID)
284                 sa_valid |= MDS_ATTR_GID;
285         if (ia_valid & ATTR_SIZE)
286                 sa_valid |= MDS_ATTR_SIZE;
287         if (ia_valid & ATTR_ATIME)
288                 sa_valid |= MDS_ATTR_ATIME;
289         if (ia_valid & ATTR_MTIME)
290                 sa_valid |= MDS_ATTR_MTIME;
291         if (ia_valid & ATTR_CTIME)
292                 sa_valid |= MDS_ATTR_CTIME;
293         if (ia_valid & ATTR_ATIME_SET)
294                 sa_valid |= MDS_ATTR_ATIME_SET;
295         if (ia_valid & ATTR_MTIME_SET)
296                 sa_valid |= MDS_ATTR_MTIME_SET;
297         if (ia_valid & ATTR_FORCE)
298                 sa_valid |= MDS_ATTR_FORCE;
299         if (ia_valid & ATTR_ATTR_FLAG)
300                 sa_valid |= MDS_ATTR_ATTR_FLAG;
301         if (ia_valid & ATTR_KILL_SUID)
302                 sa_valid |=  MDS_ATTR_KILL_SUID;
303         if (ia_valid & ATTR_KILL_SGID)
304                 sa_valid |= MDS_ATTR_KILL_SGID;
305         if (ia_valid & ATTR_CTIME_SET)
306                 sa_valid |= MDS_ATTR_CTIME_SET;
307         if (ia_valid & ATTR_FROM_OPEN)
308                 sa_valid |= MDS_ATTR_FROM_OPEN;
309         if (ia_valid & ATTR_BLOCKS)
310                 sa_valid |= MDS_ATTR_BLOCKS;
311         if (ia_valid & MDS_OPEN_OWNEROVERRIDE)
312                 /* NFSD hack (see bug 5781) */
313                 sa_valid |= MDS_OPEN_OWNEROVERRIDE;
314         return sa_valid;
315 }
316
317 static void mdc_setattr_pack_rec(struct mdt_rec_setattr *rec,
318                                  struct md_op_data *op_data)
319 {
320         rec->sa_opcode  = REINT_SETATTR;
321         rec->sa_fsuid   = from_kuid(&init_user_ns, current_fsuid());
322         rec->sa_fsgid   = from_kgid(&init_user_ns, current_fsgid());
323         rec->sa_cap     = cfs_curproc_cap_pack();
324         rec->sa_suppgid = -1;
325
326         rec->sa_fid    = op_data->op_fid1;
327         rec->sa_valid  = attr_pack(op_data->op_attr.ia_valid);
328         rec->sa_mode   = op_data->op_attr.ia_mode;
329         rec->sa_uid    = from_kuid(&init_user_ns, op_data->op_attr.ia_uid);
330         rec->sa_gid    = from_kgid(&init_user_ns, op_data->op_attr.ia_gid);
331         rec->sa_size   = op_data->op_attr.ia_size;
332         rec->sa_blocks = op_data->op_attr_blocks;
333         rec->sa_atime  = LTIME_S(op_data->op_attr.ia_atime);
334         rec->sa_mtime  = LTIME_S(op_data->op_attr.ia_mtime);
335         rec->sa_ctime  = LTIME_S(op_data->op_attr.ia_ctime);
336         rec->sa_attr_flags = op_data->op_attr_flags;
337         if ((op_data->op_attr.ia_valid & ATTR_GID) &&
338              in_group_p(op_data->op_attr.ia_gid))
339                 rec->sa_suppgid =
340                         from_kgid(&init_user_ns, op_data->op_attr.ia_gid);
341         else
342                 rec->sa_suppgid = op_data->op_suppgids[0];
343
344         rec->sa_bias = op_data->op_bias;
345 }
346
347 static void mdc_ioepoch_pack(struct mdt_ioepoch *epoch,
348                              struct md_op_data *op_data)
349 {
350         memcpy(&epoch->handle, &op_data->op_handle, sizeof(epoch->handle));
351         epoch->ioepoch = 0;
352         epoch->flags = 0;
353 }
354
355 void mdc_setattr_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
356                       void *ea, size_t ealen)
357 {
358         struct mdt_rec_setattr *rec;
359         struct lov_user_md *lum = NULL;
360
361         CLASSERT(sizeof(struct mdt_rec_reint) ==sizeof(struct mdt_rec_setattr));
362         rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
363         mdc_setattr_pack_rec(rec, op_data);
364
365         mdc_pack_capa(req, &RMF_CAPA1, op_data->op_capa1);
366
367         if (ealen == 0)
368                 return;
369
370         lum = req_capsule_client_get(&req->rq_pill, &RMF_EADATA);
371         if (ea == NULL) { /* Remove LOV EA */
372                 lum->lmm_magic = cpu_to_le32(LOV_USER_MAGIC_V1);
373                 lum->lmm_stripe_size = 0;
374                 lum->lmm_stripe_count = 0;
375                 lum->lmm_stripe_offset = (typeof(lum->lmm_stripe_offset))(-1);
376         } else {
377                 memcpy(lum, ea, ealen);
378         }
379 }
380
381 void mdc_unlink_pack(struct ptlrpc_request *req, struct md_op_data *op_data)
382 {
383         struct mdt_rec_unlink *rec;
384
385         CLASSERT(sizeof(struct mdt_rec_reint) == sizeof(struct mdt_rec_unlink));
386         rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
387         LASSERT(rec != NULL);
388
389         rec->ul_opcode  = op_data->op_cli_flags & CLI_RM_ENTRY ?
390                                         REINT_RMENTRY : REINT_UNLINK;
391         rec->ul_fsuid   = op_data->op_fsuid;
392         rec->ul_fsgid   = op_data->op_fsgid;
393         rec->ul_cap     = op_data->op_cap;
394         rec->ul_mode    = op_data->op_mode;
395         rec->ul_suppgid1= op_data->op_suppgids[0];
396         rec->ul_suppgid2= -1;
397         rec->ul_fid1    = op_data->op_fid1;
398         rec->ul_fid2    = op_data->op_fid2;
399         rec->ul_time    = op_data->op_mod_time;
400         rec->ul_bias    = op_data->op_bias;
401
402         mdc_pack_capa(req, &RMF_CAPA1, op_data->op_capa1);
403
404         mdc_pack_name(req, &RMF_NAME, op_data->op_name, op_data->op_namelen);
405 }
406
407 void mdc_link_pack(struct ptlrpc_request *req, struct md_op_data *op_data)
408 {
409         struct mdt_rec_link *rec;
410
411         CLASSERT(sizeof(struct mdt_rec_reint) == sizeof(struct mdt_rec_link));
412         rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
413         LASSERT (rec != NULL);
414
415         rec->lk_opcode   = REINT_LINK;
416         rec->lk_fsuid    = op_data->op_fsuid;//current->fsuid;
417         rec->lk_fsgid    = op_data->op_fsgid;//current->fsgid;
418         rec->lk_cap      = op_data->op_cap;//current->cap_effective;
419         rec->lk_suppgid1 = op_data->op_suppgids[0];
420         rec->lk_suppgid2 = op_data->op_suppgids[1];
421         rec->lk_fid1     = op_data->op_fid1;
422         rec->lk_fid2     = op_data->op_fid2;
423         rec->lk_time     = op_data->op_mod_time;
424         rec->lk_bias     = op_data->op_bias;
425
426         mdc_pack_capa(req, &RMF_CAPA1, op_data->op_capa1);
427         mdc_pack_capa(req, &RMF_CAPA2, op_data->op_capa2);
428
429         mdc_pack_name(req, &RMF_NAME, op_data->op_name, op_data->op_namelen);
430 }
431
432 void mdc_rename_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
433                      const char *old, size_t oldlen,
434                      const char *new, size_t newlen)
435 {
436         struct mdt_rec_rename *rec;
437
438         CLASSERT(sizeof(struct mdt_rec_reint) == sizeof(struct mdt_rec_rename));
439         rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
440
441         /* XXX do something about time, uid, gid */
442         rec->rn_opcode  = op_data->op_cli_flags & CLI_MIGRATE ?
443                                         REINT_MIGRATE : REINT_RENAME;
444         rec->rn_fsuid    = op_data->op_fsuid;
445         rec->rn_fsgid    = op_data->op_fsgid;
446         rec->rn_cap      = op_data->op_cap;
447         rec->rn_suppgid1 = op_data->op_suppgids[0];
448         rec->rn_suppgid2 = op_data->op_suppgids[1];
449         rec->rn_fid1     = op_data->op_fid1;
450         rec->rn_fid2     = op_data->op_fid2;
451         rec->rn_time     = op_data->op_mod_time;
452         rec->rn_mode     = op_data->op_mode;
453         rec->rn_bias     = op_data->op_bias;
454
455         mdc_pack_capa(req, &RMF_CAPA1, op_data->op_capa1);
456         mdc_pack_capa(req, &RMF_CAPA2, op_data->op_capa2);
457
458         mdc_pack_name(req, &RMF_NAME, old, oldlen);
459
460         if (new != NULL)
461                 mdc_pack_name(req, &RMF_SYMTGT, new, newlen);
462 }
463
464 void mdc_getattr_pack(struct ptlrpc_request *req, __u64 valid, __u32 flags,
465                       struct md_op_data *op_data, size_t ea_size)
466 {
467         struct mdt_body *b = req_capsule_client_get(&req->rq_pill,
468                                                     &RMF_MDT_BODY);
469
470         b->mbo_valid = valid;
471         if (op_data->op_bias & MDS_CHECK_SPLIT)
472                 b->mbo_valid |= OBD_MD_FLCKSPLIT;
473         if (op_data->op_bias & MDS_CROSS_REF)
474                 b->mbo_valid |= OBD_MD_FLCROSSREF;
475         b->mbo_eadatasize = ea_size;
476         b->mbo_flags = flags;
477         __mdc_pack_body(b, op_data->op_suppgids[0]);
478
479         b->mbo_fid1 = op_data->op_fid1;
480         b->mbo_fid2 = op_data->op_fid2;
481         b->mbo_valid |= OBD_MD_FLID;
482
483         mdc_pack_capa(req, &RMF_CAPA1, op_data->op_capa1);
484
485         if (op_data->op_name != NULL)
486                 mdc_pack_name(req, &RMF_NAME, op_data->op_name,
487                               op_data->op_namelen);
488 }
489
490 static void mdc_hsm_release_pack(struct ptlrpc_request *req,
491                                  struct md_op_data *op_data)
492 {
493         if (op_data->op_bias & MDS_HSM_RELEASE) {
494                 struct close_data *data;
495                 struct ldlm_lock *lock;
496
497                 data = req_capsule_client_get(&req->rq_pill, &RMF_CLOSE_DATA);
498                 LASSERT(data != NULL);
499
500                 lock = ldlm_handle2lock(&op_data->op_lease_handle);
501                 if (lock != NULL) {
502                         data->cd_handle = lock->l_remote_handle;
503                         LDLM_LOCK_PUT(lock);
504                 }
505                 ldlm_cli_cancel(&op_data->op_lease_handle, LCF_LOCAL);
506
507                 data->cd_data_version = op_data->op_data_version;
508                 data->cd_fid = op_data->op_fid2;
509         }
510 }
511
512 void mdc_close_pack(struct ptlrpc_request *req, struct md_op_data *op_data)
513 {
514         struct mdt_ioepoch *epoch;
515         struct mdt_rec_setattr *rec;
516
517         epoch = req_capsule_client_get(&req->rq_pill, &RMF_MDT_EPOCH);
518         rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
519
520         mdc_setattr_pack_rec(rec, op_data);
521         mdc_pack_capa(req, &RMF_CAPA1, op_data->op_capa1);
522         mdc_ioepoch_pack(epoch, op_data);
523         mdc_hsm_release_pack(req, op_data);
524 }