Whamcloud - gitweb
LU-13597 ofd: add more information to job_stats
[fs/lustre-release.git] / lustre / mdt / mdt_xattr.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2011, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/mdt/mdt_xattr.c
33  *
34  * Lustre Metadata Target (mdt) extended attributes management.
35  *
36  * Author: Peter Braam <braam@clusterfs.com>
37  * Author: Andreas Dilger <adilger@clusterfs.com>
38  * Author: Phil Schwan <phil@clusterfs.com>
39  * Author: Huang Hua <huanghua@clusterfs.com>
40  */
41
42 #define DEBUG_SUBSYSTEM S_MDS
43
44 #include <linux/xattr.h>
45 #include <obd_class.h>
46 #include <lustre_nodemap.h>
47 #include <lustre_acl.h>
48 #include <lustre_lmv.h>
49 #include "mdt_internal.h"
50
51
52 /* return EADATA length to the caller. negative value means error */
53 static int mdt_getxattr_pack_reply(struct mdt_thread_info *info)
54 {
55         struct req_capsule *pill = info->mti_pill;
56         struct ptlrpc_request *req = mdt_info_req(info);
57         const char *xattr_name;
58         u64 valid;
59         static const char user_string[] = "user.";
60         int size;
61         int rc = 0;
62         int rc2;
63         ENTRY;
64
65         valid = info->mti_body->mbo_valid & (OBD_MD_FLXATTR | OBD_MD_FLXATTRLS);
66
67         /* Determine how many bytes we need */
68         if (valid == OBD_MD_FLXATTR) {
69                 xattr_name = req_capsule_client_get(pill, &RMF_NAME);
70                 if (!xattr_name)
71                         RETURN(-EFAULT);
72
73                 if (!(exp_connect_flags(req->rq_export) & OBD_CONNECT_XATTR) &&
74                     !strncmp(xattr_name, user_string, sizeof(user_string) - 1))
75                         RETURN(-EOPNOTSUPP);
76
77                 size = mo_xattr_get(info->mti_env,
78                                     mdt_object_child(info->mti_object),
79                                     &LU_BUF_NULL, xattr_name);
80                 if (size == -ENODATA) {
81                         /* XXX: Some client code will not handle -ENODATA
82                          * for XATTR_NAME_LOV (trusted.lov) properly.
83                          */
84                         if (strcmp(xattr_name, XATTR_NAME_LOV) == 0)
85                                 rc = 0;
86                         else
87                                 rc = -ENODATA;
88
89                         size = 0;
90                 }
91         } else if (valid == OBD_MD_FLXATTRLS) {
92                 xattr_name = "list";
93                 size = mo_xattr_list(info->mti_env,
94                                      mdt_object_child(info->mti_object),
95                                      &LU_BUF_NULL);
96         } else if (valid == OBD_MD_FLXATTRALL) {
97                 xattr_name = "all";
98                 /* N.B. eadatasize = 0 is not valid for FLXATTRALL */
99                 /* We could calculate accurate sizes, but this would
100                  * introduce a lot of overhead, let's do it later...
101                  */
102                 size = info->mti_body->mbo_eadatasize;
103                 if (size <= 0 || size > info->mti_mdt->mdt_max_ea_size ||
104                     size & (sizeof(__u32) - 1)) {
105                         DEBUG_REQ(D_ERROR, req,
106                                   "%s: invalid EA size(%d) for FLXATTRALL\n",
107                                   mdt_obd_name(info->mti_mdt), size);
108                         RETURN(-EINVAL);
109                 }
110                 req_capsule_set_size(pill, &RMF_EAVALS, RCL_SERVER, size);
111                 req_capsule_set_size(pill, &RMF_EAVALS_LENS, RCL_SERVER, size);
112         } else {
113                 CDEBUG(D_INFO, "Valid bits: %#llx\n",
114                        info->mti_body->mbo_valid);
115                 RETURN(-EINVAL);
116         }
117
118         if (size < 0) {
119                 if (size != -EOPNOTSUPP && size != -ENOENT)
120                         CERROR("%s: error geting EA size for '%s': rc = %d\n",
121                                mdt_obd_name(info->mti_mdt), xattr_name, size);
122                 RETURN(size);
123         }
124
125         if (req_capsule_has_field(pill, &RMF_ACL, RCL_SERVER))
126                 req_capsule_set_size(pill, &RMF_ACL, RCL_SERVER,
127                                      LUSTRE_POSIX_ACL_MAX_SIZE_OLD);
128
129         req_capsule_set_size(pill, &RMF_EADATA, RCL_SERVER,
130                              info->mti_body->mbo_eadatasize == 0 ? 0 : size);
131
132         rc2 = req_capsule_server_pack(pill);
133         if (rc2 < 0)
134                 RETURN(rc2);
135
136         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_GETXATTR_PACK))
137                 RETURN(-ENOMEM);
138
139         RETURN(rc < 0 ? rc : size);
140 }
141
142 static int mdt_nodemap_map_acl(struct mdt_thread_info *info, void *buf,
143                                size_t size, const char *name,
144                                enum nodemap_tree_type tree_type)
145 {
146         struct lu_nodemap      *nodemap;
147         struct obd_export      *exp = info->mti_exp;
148         int                     rc = size;
149
150         ENTRY;
151
152         if (strcmp(name, XATTR_NAME_ACL_ACCESS) == 0 ||
153             strcmp(name, XATTR_NAME_ACL_DEFAULT) == 0) {
154                 if (size > info->mti_mdt->mdt_max_ea_size ||
155                      (!exp_connect_large_acl(exp) &&
156                       size > LUSTRE_POSIX_ACL_MAX_SIZE_OLD))
157                         GOTO(out, rc = -ERANGE);
158
159                 nodemap = nodemap_get_from_exp(exp);
160                 if (IS_ERR(nodemap))
161                         GOTO(out, rc = PTR_ERR(nodemap));
162
163                 rc = nodemap_map_acl(nodemap, buf, size, tree_type);
164                 nodemap_putref(nodemap);
165                 if (rc < 0)
166                         GOTO(out, rc);
167         }
168 out:
169         RETURN(rc);
170 }
171
172 static int mdt_getxattr_all(struct mdt_thread_info *info,
173                             struct mdt_body *reqbody, struct mdt_body *repbody,
174                             struct lu_buf *buf, struct md_object *next)
175 {
176         const struct lu_env *env = info->mti_env;
177         char *v, *b, *eadatahead, *eadatatail;
178         __u32 *sizes;
179         int eadatasize, eavallen = 0, eavallens = 0, rc;
180
181         ENTRY;
182
183         /*
184          * The format of the pill is the following:
185          * EADATA:      attr1\0attr2\0...attrn\0
186          * EAVALS:      val1val2...valn
187          * EAVALS_LENS: 4,4,...4
188          */
189
190         eadatahead = buf->lb_buf;
191
192         /* Fill out EADATA first */
193         rc = mo_xattr_list(env, next, buf);
194         if (rc < 0)
195                 GOTO(out_shrink, rc);
196
197         eadatasize = rc;
198         eadatatail = eadatahead + eadatasize;
199
200         v = req_capsule_server_get(info->mti_pill, &RMF_EAVALS);
201         sizes = req_capsule_server_get(info->mti_pill, &RMF_EAVALS_LENS);
202
203         /* Fill out EAVALS and EAVALS_LENS */
204         for (b = eadatahead; b < eadatatail; b += strlen(b) + 1, v += rc) {
205                 buf->lb_buf = v;
206                 buf->lb_len = reqbody->mbo_eadatasize - eavallen;
207                 rc = mo_xattr_get(env, next, buf, b);
208                 if (rc < 0)
209                         GOTO(out_shrink, rc);
210                 rc = mdt_nodemap_map_acl(info, buf->lb_buf, rc, b,
211                                          NODEMAP_FS_TO_CLIENT);
212                 if (rc < 0)
213                         GOTO(out_shrink, rc);
214                 sizes[eavallens] = rc;
215                 eavallens++;
216                 eavallen += rc;
217         }
218
219 out_shrink:
220         if (rc < 0) {
221                 eadatasize = 0;
222                 eavallens = 0;
223                 eavallen = 0;
224         }
225         repbody->mbo_aclsize = eavallen;
226         repbody->mbo_max_mdsize = eavallens;
227
228         req_capsule_shrink(info->mti_pill, &RMF_EAVALS, eavallen, RCL_SERVER);
229         req_capsule_shrink(info->mti_pill, &RMF_EAVALS_LENS,
230                            eavallens * sizeof(__u32), RCL_SERVER);
231         req_capsule_shrink(info->mti_pill, &RMF_EADATA, eadatasize, RCL_SERVER);
232
233         if (rc >= 0)
234                 RETURN(eadatasize);
235         return rc;
236 }
237
238 int mdt_getxattr(struct mdt_thread_info *info)
239 {
240         struct ptlrpc_request  *req = mdt_info_req(info);
241         struct mdt_body        *reqbody;
242         struct mdt_body        *repbody = NULL;
243         struct md_object       *next;
244         struct lu_buf          *buf;
245         int                     easize, rc;
246         u64                     valid;
247         ktime_t                 kstart = ktime_get();
248         ENTRY;
249
250         LASSERT(info->mti_object != NULL);
251         LASSERT(lu_object_assert_exists(&info->mti_object->mot_obj));
252
253         CDEBUG(D_INODE, "getxattr "DFID"\n", PFID(&info->mti_body->mbo_fid1));
254
255         rc = req_check_sepol(info->mti_pill);
256         if (rc)
257                 RETURN(err_serious(rc));
258
259         reqbody = req_capsule_client_get(info->mti_pill, &RMF_MDT_BODY);
260         if (reqbody == NULL)
261                 RETURN(err_serious(-EFAULT));
262
263         rc = mdt_init_ucred(info, reqbody);
264         if (rc)
265                 RETURN(err_serious(rc));
266
267         next = mdt_object_child(info->mti_object);
268         easize = mdt_getxattr_pack_reply(info);
269         if (easize == -ENODATA)
270                 GOTO(out, rc = easize);
271         else if (easize < 0)
272                 GOTO(out, rc = err_serious(easize));
273
274         repbody = req_capsule_server_get(info->mti_pill, &RMF_MDT_BODY);
275         LASSERT(repbody != NULL);
276
277         /* No need further getxattr. */
278         if (easize == 0 || reqbody->mbo_eadatasize == 0)
279                 GOTO(out, rc = easize);
280
281         buf = &info->mti_buf;
282         buf->lb_buf = req_capsule_server_get(info->mti_pill, &RMF_EADATA);
283         buf->lb_len = easize;
284
285         valid = info->mti_body->mbo_valid & (OBD_MD_FLXATTR | OBD_MD_FLXATTRLS);
286
287         if (valid == OBD_MD_FLXATTR) {
288                 const char *xattr_name = req_capsule_client_get(info->mti_pill,
289                                                                 &RMF_NAME);
290                 rc = mo_xattr_get(info->mti_env, next, buf, xattr_name);
291                 if (rc < 0)
292                         GOTO(out, rc);
293
294                 rc = mdt_nodemap_map_acl(info, buf->lb_buf, rc, xattr_name,
295                                          NODEMAP_FS_TO_CLIENT);
296         } else if (valid == OBD_MD_FLXATTRLS) {
297                 CDEBUG(D_INODE, "listxattr\n");
298
299                 rc = mo_xattr_list(info->mti_env, next, buf);
300                 if (rc < 0)
301                         CDEBUG(D_INFO, "listxattr failed: %d\n", rc);
302         } else if (valid == OBD_MD_FLXATTRALL) {
303                 rc = mdt_getxattr_all(info, reqbody, repbody,
304                                       buf, next);
305         } else
306                 LBUG();
307
308         EXIT;
309 out:
310         if (rc >= 0) {
311                 mdt_counter_incr(req, LPROC_MDT_GETXATTR,
312                                  ktime_us_delta(ktime_get(), kstart));
313                 /* LU-11109: Set OBD_MD_FLXATTR on success so that
314                  * newer clients can distinguish between nonexistent
315                  * xattrs and zero length values.
316                  */
317                 repbody->mbo_valid |= OBD_MD_FLXATTR;
318                 repbody->mbo_eadatasize = rc;
319                 rc = 0;
320         }
321         mdt_exit_ucred(info);
322         return rc;
323 }
324
325 /* update dir layout after migration/restripe */
326 int mdt_dir_layout_update(struct mdt_thread_info *info)
327 {
328         const struct lu_env *env = info->mti_env;
329         struct mdt_device *mdt = info->mti_mdt;
330         struct lu_ucred *uc = mdt_ucred(info);
331         struct mdt_reint_record *rr = &info->mti_rr;
332         struct lmv_user_md *lmu = rr->rr_eadata;
333         __u32 lum_stripe_count = lmu->lum_stripe_count;
334         struct md_layout_change *mlc = &info->mti_mlc;
335         struct lmv_mds_md_v1 *lmv;
336         struct md_attr *ma = &info->mti_attr;
337         struct ldlm_enqueue_info *einfo = &info->mti_einfo[0];
338         struct mdt_object *pobj = NULL;
339         struct mdt_object *obj;
340         struct mdt_lock_handle *lhp = NULL;
341         struct mdt_lock_handle *lhc;
342         bool shrink = false;
343         int rc;
344
345         ENTRY;
346
347         if (!mdt->mdt_enable_dir_migration)
348                 RETURN(-EPERM);
349
350         if (!md_capable(uc, CFS_CAP_SYS_ADMIN) &&
351             uc->uc_gid != mdt->mdt_enable_remote_dir_gid &&
352             mdt->mdt_enable_remote_dir_gid != -1)
353                 RETURN(-EPERM);
354
355         obj = mdt_object_find(env, mdt, rr->rr_fid1);
356         if (IS_ERR(obj))
357                 RETURN(PTR_ERR(obj));
358
359         /* get parent from PFID */
360         rc = mdt_attr_get_pfid(info, obj, &ma->ma_pfid);
361         if (rc)
362                 GOTO(put_obj, rc);
363
364         pobj = mdt_object_find(env, mdt, &ma->ma_pfid);
365         if (IS_ERR(pobj))
366                 GOTO(put_obj, rc = PTR_ERR(pobj));
367
368         /* revoke object remote LOOKUP lock */
369         if (mdt_object_remote(pobj)) {
370                 rc = mdt_revoke_remote_lookup_lock(info, pobj, obj);
371                 if (rc)
372                         GOTO(put_pobj, rc);
373         }
374
375         /*
376          * lock parent if dir will be shrunk to 1 stripe, because dir will be
377          * converted to normal directory, as will change dir FID and update
378          * namespace of parent.
379          */
380         lhp = &info->mti_lh[MDT_LH_PARENT];
381         mdt_lock_reg_init(lhp, LCK_PW);
382
383         if (le32_to_cpu(lmu->lum_stripe_count) < 2) {
384                 rc = mdt_reint_object_lock(info, pobj, lhp,
385                                            MDS_INODELOCK_UPDATE, true);
386                 if (rc)
387                         GOTO(put_pobj, rc);
388         }
389
390         /* lock object */
391         lhc = &info->mti_lh[MDT_LH_CHILD];
392         mdt_lock_reg_init(lhc, LCK_EX);
393         rc = mdt_reint_striped_lock(info, obj, lhc, MDS_INODELOCK_FULL, einfo,
394                                     true);
395         if (rc)
396                 GOTO(unlock_pobj, rc);
397
398         rc = mdt_stripe_get(info, obj, ma, XATTR_NAME_LMV);
399         if (rc)
400                 GOTO(unlock_obj, rc);
401
402         /* user may run 'lfs migrate' multiple times, so it's shrunk already */
403         if (!(ma->ma_valid & MA_LMV))
404                 GOTO(unlock_obj, rc = -EALREADY);
405
406         lmv = &ma->ma_lmv->lmv_md_v1;
407         if (!lmv_is_sane(lmv))
408                 GOTO(unlock_obj, rc = -EBADF);
409
410         /* ditto */
411         if (!lmv_is_layout_changing(lmv))
412                 GOTO(unlock_obj, rc = -EALREADY);
413
414         lum_stripe_count = lmu->lum_stripe_count;
415         if (!lum_stripe_count)
416                 lum_stripe_count = cpu_to_le32(1);
417
418         if (lmv_is_migrating(lmv)) {
419                 if (lmv->lmv_migrate_offset != lum_stripe_count) {
420                         CERROR("%s: "DFID" migrate mdt count mismatch %u != %u\n",
421                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
422                                 lmv->lmv_migrate_offset, lmu->lum_stripe_count);
423                         GOTO(unlock_obj, rc = -EINVAL);
424                 }
425
426                 if (lmu->lum_stripe_offset != lmv->lmv_master_mdt_index) {
427                         CERROR("%s: "DFID" migrate mdt index mismatch %u != %u\n",
428                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
429                                 lmv->lmv_master_mdt_index,
430                                 lmu->lum_stripe_offset);
431                         GOTO(unlock_obj, rc = -EINVAL);
432                 }
433
434                 if (lum_stripe_count > 1 && lmu->lum_hash_type &&
435                     lmu->lum_hash_type !=
436                     (lmv->lmv_hash_type & cpu_to_le32(LMV_HASH_TYPE_MASK))) {
437                         CERROR("%s: "DFID" migrate mdt hash mismatch %u != %u\n",
438                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
439                                 lmv->lmv_hash_type, lmu->lum_hash_type);
440                         GOTO(unlock_obj, rc = -EINVAL);
441                 }
442
443                 shrink = true;
444         } else if (lmv_is_splitting(lmv)) {
445                 if (lmv->lmv_stripe_count != lum_stripe_count) {
446                         CERROR("%s: "DFID" stripe count mismatch %u != %u\n",
447                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
448                                 lmv->lmv_stripe_count, lmu->lum_stripe_count);
449                         GOTO(unlock_obj, rc = -EINVAL);
450                 }
451
452                 if (lmu->lum_stripe_offset != LMV_OFFSET_DEFAULT) {
453                         CERROR("%s: "DFID" dir split offset %u != -1\n",
454                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
455                                 lmu->lum_stripe_offset);
456                         GOTO(unlock_obj, rc = -EINVAL);
457                 }
458
459                 if (lmu->lum_hash_type &&
460                     lmu->lum_hash_type !=
461                     (lmv->lmv_hash_type & cpu_to_le32(LMV_HASH_TYPE_MASK))) {
462                         CERROR("%s: "DFID" split hash mismatch %u != %u\n",
463                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
464                                 lmv->lmv_hash_type, lmu->lum_hash_type);
465                         GOTO(unlock_obj, rc = -EINVAL);
466                 }
467         } else if (lmv_is_merging(lmv)) {
468                 if (lmv->lmv_merge_offset != lum_stripe_count) {
469                         CERROR("%s: "DFID" stripe count mismatch %u != %u\n",
470                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
471                                 lmv->lmv_merge_offset, lmu->lum_stripe_count);
472                         GOTO(unlock_obj, rc = -EINVAL);
473                 }
474
475                 if (lmu->lum_stripe_offset != LMV_OFFSET_DEFAULT) {
476                         CERROR("%s: "DFID" dir merge offset %u != -1\n",
477                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
478                                 lmu->lum_stripe_offset);
479                         GOTO(unlock_obj, rc = -EINVAL);
480                 }
481
482                 if (lmu->lum_hash_type &&
483                     lmu->lum_hash_type !=
484                     (lmv->lmv_merge_hash & cpu_to_le32(LMV_HASH_TYPE_MASK))) {
485                         CERROR("%s: "DFID" merge hash mismatch %u != %u\n",
486                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
487                                 lmv->lmv_merge_hash, lmu->lum_hash_type);
488                         GOTO(unlock_obj, rc = -EINVAL);
489                 }
490
491                 if (lum_stripe_count < lmv->lmv_stripe_count)
492                         shrink = true;
493         }
494
495         if (shrink) {
496                 mlc->mlc_opc = MD_LAYOUT_SHRINK;
497                 mlc->mlc_buf.lb_buf = rr->rr_eadata;
498                 mlc->mlc_buf.lb_len = rr->rr_eadatalen;
499                 rc = mo_layout_change(env, mdt_object_child(obj), mlc);
500         } else {
501                 struct lu_buf *buf = &info->mti_buf;
502                 u32 version = le32_to_cpu(lmv->lmv_layout_version);
503
504                 lmv->lmv_hash_type &= ~LMV_HASH_FLAG_LAYOUT_CHANGE;
505                 lmv->lmv_layout_version = cpu_to_le32(++version);
506                 buf->lb_buf = lmv;
507                 buf->lb_len = sizeof(*lmv);
508                 rc = mo_xattr_set(env, mdt_object_child(obj), buf,
509                                   XATTR_NAME_LMV, LU_XATTR_REPLACE);
510         }
511         GOTO(unlock_obj, rc);
512
513 unlock_obj:
514         mdt_reint_striped_unlock(info, obj, lhc, einfo, rc);
515 unlock_pobj:
516         mdt_object_unlock(info, pobj, lhp, rc);
517 put_pobj:
518         mdt_object_put(env, pobj);
519 put_obj:
520         mdt_object_put(env, obj);
521
522         return rc;
523 }
524
525 int mdt_reint_setxattr(struct mdt_thread_info *info,
526                        struct mdt_lock_handle *unused)
527 {
528         struct ptlrpc_request   *req = mdt_info_req(info);
529         struct mdt_lock_handle  *lh;
530         const struct lu_env     *env  = info->mti_env;
531         struct lu_buf           *buf  = &info->mti_buf;
532         struct mdt_reint_record *rr   = &info->mti_rr;
533         struct md_attr          *ma = &info->mti_attr;
534         struct lu_attr          *attr = &info->mti_attr.ma_attr;
535         struct mdt_object       *obj;
536         struct md_object        *child;
537         __u64                    valid = attr->la_valid;
538         const char              *xattr_name = rr->rr_name.ln_name;
539         int                      xattr_len = rr->rr_eadatalen;
540         __u64                    lockpart = MDS_INODELOCK_UPDATE;
541         ktime_t                  kstart = ktime_get();
542         int                      rc;
543         ENTRY;
544
545         CDEBUG(D_INODE, "setxattr for "DFID": %s %s\n", PFID(rr->rr_fid1),
546                valid & OBD_MD_FLXATTR ? "set" : "remove", xattr_name);
547
548         if (info->mti_dlm_req)
549                 ldlm_request_cancel(req, info->mti_dlm_req, 0, LATF_SKIP);
550
551         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_SETXATTR))
552                 RETURN(err_serious(-ENOMEM));
553
554         rc = mdt_init_ucred_reint(info);
555         if (rc != 0)
556                 RETURN(rc);
557
558         if (strncmp(xattr_name, XATTR_USER_PREFIX,
559                     sizeof(XATTR_USER_PREFIX) - 1) == 0) {
560                 if (!(exp_connect_flags(req->rq_export) & OBD_CONNECT_XATTR))
561                         GOTO(out, rc = -EOPNOTSUPP);
562         } else if (strncmp(xattr_name, XATTR_TRUSTED_PREFIX,
563                     sizeof(XATTR_TRUSTED_PREFIX) - 1) == 0) {
564
565                 /* setxattr(LMV) with lum is used to shrink dir layout */
566                 if (strcmp(xattr_name, XATTR_NAME_LMV) == 0) {
567                         __u32 *magic = rr->rr_eadata;
568
569                         /* we don't let to remove LMV? */
570                         if (!rr->rr_eadata)
571                                 GOTO(out, rc = 0);
572
573                         if (le32_to_cpu(*magic) == LMV_USER_MAGIC ||
574                             le32_to_cpu(*magic) == LMV_USER_MAGIC_SPECIFIC) {
575                                 rc = mdt_dir_layout_update(info);
576                                 GOTO(out, rc);
577                         }
578                 }
579
580                 if (!md_capable(mdt_ucred(info), CFS_CAP_SYS_ADMIN))
581                         GOTO(out, rc = -EPERM);
582
583                 if (strcmp(xattr_name, XATTR_NAME_LOV) == 0 ||
584                     strcmp(xattr_name, XATTR_NAME_LMA) == 0 ||
585                     strcmp(xattr_name, XATTR_NAME_LMV) == 0 ||
586                     strcmp(xattr_name, XATTR_NAME_LINK) == 0 ||
587                     strcmp(xattr_name, XATTR_NAME_FID) == 0 ||
588                     strcmp(xattr_name, XATTR_NAME_VERSION) == 0 ||
589                     strcmp(xattr_name, XATTR_NAME_SOM) == 0 ||
590                     strcmp(xattr_name, XATTR_NAME_HSM) == 0 ||
591                     strcmp(xattr_name, XATTR_NAME_LFSCK_NAMESPACE) == 0)
592                         GOTO(out, rc = 0);
593         } else if ((valid & OBD_MD_FLXATTR) &&
594                    (strcmp(xattr_name, XATTR_NAME_ACL_ACCESS) == 0 ||
595                     strcmp(xattr_name, XATTR_NAME_ACL_DEFAULT) == 0)) {
596                 rc = mdt_nodemap_map_acl(info, rr->rr_eadata, xattr_len,
597                                          xattr_name, NODEMAP_CLIENT_TO_FS);
598                 if (rc < 0)
599                         GOTO(out, rc);
600                 /* ACLs were mapped out, return an error so the user knows */
601                 if (rc != xattr_len)
602                         GOTO(out, rc = -EPERM);
603         } else if ((strlen(xattr_name) > sizeof(XATTR_LUSTRE_LOV)) &&
604                    strncmp(xattr_name, XATTR_LUSTRE_LOV,
605                            strlen(XATTR_LUSTRE_LOV)) == 0) {
606
607                 if (!allowed_lustre_lov(xattr_name)) {
608                         CERROR("%s: invalid xattr name: %s\n",
609                                mdt_obd_name(info->mti_mdt), xattr_name);
610                         GOTO(out, rc = -EINVAL);
611                 }
612
613                 lockpart |= MDS_INODELOCK_LAYOUT;
614         }
615
616         /* Revoke all clients' lookup lock, since the access
617          * permissions for this inode is changed when ACL_ACCESS is
618          * set. This isn't needed for ACL_DEFAULT, since that does
619          * not change the access permissions of this inode, nor any
620          * other existing inodes. It is setting the ACLs inherited
621          * by new directories/files at create time.
622          */
623         /* We need revoke both LOOKUP|PERM lock here, see mdt_attr_set. */
624         if (!strcmp(xattr_name, XATTR_NAME_ACL_ACCESS))
625                 lockpart |= MDS_INODELOCK_PERM | MDS_INODELOCK_LOOKUP;
626         /* We need to take the lock on behalf of old clients so that newer
627          * clients flush their xattr caches
628          */
629         else
630                 lockpart |= MDS_INODELOCK_XATTR;
631
632         lh = &info->mti_lh[MDT_LH_PARENT];
633         /* ACLs were sent to clients under LCK_CR locks, so taking LCK_EX
634          * to cancel them.
635          */
636         mdt_lock_reg_init(lh, LCK_EX);
637         obj = mdt_object_find_lock(info, rr->rr_fid1, lh, lockpart);
638         if (IS_ERR(obj))
639                 GOTO(out, rc = PTR_ERR(obj));
640
641         tgt_vbr_obj_set(env, mdt_obj2dt(obj));
642         rc = mdt_version_get_check_save(info, obj, 0);
643         if (rc)
644                 GOTO(out_unlock, rc);
645
646         if (unlikely(!(valid & OBD_MD_FLCTIME))) {
647                 /* This isn't strictly an error, but all current clients
648                  * should set OBD_MD_FLCTIME when setting attributes.
649                  */
650                 CWARN("%s: client miss to set OBD_MD_FLCTIME when setxattr %s: [object "DFID"] [valid %llu]\n",
651                       mdt_obd_name(info->mti_mdt), xattr_name,
652                       PFID(rr->rr_fid1), valid);
653                 attr->la_ctime = ktime_get_real_seconds();
654         }
655         attr->la_valid = LA_CTIME;
656         child = mdt_object_child(obj);
657         if (valid & OBD_MD_FLXATTR) {
658                 int     flags = 0;
659
660                 if (attr->la_flags & XATTR_REPLACE)
661                         flags |= LU_XATTR_REPLACE;
662
663                 if (attr->la_flags & XATTR_CREATE)
664                         flags |= LU_XATTR_CREATE;
665
666                 mdt_fail_write(env, info->mti_mdt->mdt_bottom,
667                                OBD_FAIL_MDS_SETXATTR_WRITE);
668
669                 buf->lb_buf = rr->rr_eadata;
670                 buf->lb_len = xattr_len;
671                 rc = mo_xattr_set(env, child, buf, xattr_name, flags);
672                 /* update ctime after xattr changed */
673                 if (rc == 0) {
674                         ma->ma_attr_flags |= MDS_PERM_BYPASS;
675                         mo_attr_set(env, child, ma);
676                 }
677         } else if (valid & OBD_MD_FLXATTRRM) {
678                 rc = mo_xattr_del(env, child, xattr_name);
679                 /* update ctime after xattr changed */
680                 if (rc == 0) {
681                         ma->ma_attr_flags |= MDS_PERM_BYPASS;
682                         mo_attr_set(env, child, ma);
683                 }
684         } else {
685                 CDEBUG(D_INFO, "valid bits: %#llx\n", valid);
686                 rc = -EINVAL;
687         }
688
689         if (rc == 0)
690                 mdt_counter_incr(req, LPROC_MDT_SETXATTR,
691                                  ktime_us_delta(ktime_get(), kstart));
692
693         EXIT;
694 out_unlock:
695         mdt_object_unlock_put(info, obj, lh, rc);
696 out:
697         mdt_exit_ucred(info);
698         return rc;
699 }