Whamcloud - gitweb
LU-17705 ptlrpc: replace synchronize_rcu() with rcu_barrier()
[fs/lustre-release.git] / lustre / mdt / mdt_xattr.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2011, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/mdt/mdt_xattr.c
33  *
34  * Lustre Metadata Target (mdt) extended attributes management.
35  *
36  * Author: Peter Braam <braam@clusterfs.com>
37  * Author: Andreas Dilger <adilger@clusterfs.com>
38  * Author: Phil Schwan <phil@clusterfs.com>
39  * Author: Huang Hua <huanghua@clusterfs.com>
40  */
41
42 #define DEBUG_SUBSYSTEM S_MDS
43
44 #include <linux/xattr.h>
45 #include <obd_class.h>
46 #include <lustre_nodemap.h>
47 #include <lustre_acl.h>
48 #include <lustre_lmv.h>
49 #include "mdt_internal.h"
50
51
52 /* return EADATA length to the caller. negative value means error */
53 static int mdt_getxattr_pack_reply(struct mdt_thread_info * info)
54 {
55         struct req_capsule *pill = info->mti_pill;
56         struct ptlrpc_request *req = mdt_info_req(info);
57         const char *xattr_name;
58         u64 valid;
59         static const char user_string[] = "user.";
60         int size;
61         int rc = 0;
62         int rc2;
63         ENTRY;
64
65         valid = info->mti_body->mbo_valid & (OBD_MD_FLXATTR | OBD_MD_FLXATTRLS);
66
67         /* Determine how many bytes we need */
68         if (valid == OBD_MD_FLXATTR) {
69                 xattr_name = req_capsule_client_get(pill, &RMF_NAME);
70                 if (!xattr_name)
71                         RETURN(-EFAULT);
72
73                 if (!(exp_connect_flags(req->rq_export) & OBD_CONNECT_XATTR) &&
74                     !strncmp(xattr_name, user_string, sizeof(user_string) - 1))
75                         RETURN(-EOPNOTSUPP);
76
77                 size = mo_xattr_get(info->mti_env,
78                                     mdt_object_child(info->mti_object),
79                                     &LU_BUF_NULL, xattr_name);
80                 if (size == -ENODATA) {
81                         /* XXX: Some client code will not handle -ENODATA
82                          * for XATTR_NAME_LOV (trusted.lov) properly. */
83                         if (strcmp(xattr_name, XATTR_NAME_LOV) == 0)
84                                 rc = 0;
85                         else
86                                 rc = -ENODATA;
87
88                         size = 0;
89                 }
90         } else if (valid == OBD_MD_FLXATTRLS) {
91                 xattr_name = "list";
92                 size = mo_xattr_list(info->mti_env,
93                                      mdt_object_child(info->mti_object),
94                                      &LU_BUF_NULL);
95         } else if (valid == OBD_MD_FLXATTRALL) {
96                 xattr_name = "all";
97                 /* N.B. eadatasize = 0 is not valid for FLXATTRALL */
98                 /* We could calculate accurate sizes, but this would
99                  * introduce a lot of overhead, let's do it later... */
100                 size = info->mti_body->mbo_eadatasize;
101                 if (size <= 0 || size > info->mti_mdt->mdt_max_ea_size ||
102                     size & (sizeof(__u32) - 1)) {
103                         DEBUG_REQ(D_ERROR, req,
104                                   "%s: invalid EA size(%d) for FLXATTRALL\n",
105                                   mdt_obd_name(info->mti_mdt), size);
106                         RETURN(-EINVAL);
107                 }
108                 req_capsule_set_size(pill, &RMF_EAVALS, RCL_SERVER, size);
109                 req_capsule_set_size(pill, &RMF_EAVALS_LENS, RCL_SERVER, size);
110         } else {
111                 CDEBUG(D_INFO, "Valid bits: %#llx\n",
112                        info->mti_body->mbo_valid);
113                 RETURN(-EINVAL);
114         }
115
116         if (size < 0) {
117                 if (size != -EOPNOTSUPP && size != -ENOENT)
118                         CERROR("%s: error geting EA size for '%s': rc = %d\n",
119                                mdt_obd_name(info->mti_mdt), xattr_name, size);
120                 RETURN(size);
121         }
122
123         if (req_capsule_has_field(pill, &RMF_ACL, RCL_SERVER))
124                 req_capsule_set_size(pill, &RMF_ACL, RCL_SERVER,
125                                      LUSTRE_POSIX_ACL_MAX_SIZE_OLD);
126
127         req_capsule_set_size(pill, &RMF_EADATA, RCL_SERVER,
128                              info->mti_body->mbo_eadatasize == 0 ? 0 : size);
129
130         rc2 = req_capsule_server_pack(pill);
131         if (rc2 < 0)
132                 RETURN(rc2);
133
134         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_GETXATTR_PACK))
135                 RETURN(-ENOMEM);
136
137         RETURN(rc < 0 ? rc : size);
138 }
139
140 static int mdt_nodemap_map_acl(struct mdt_thread_info *info, void *buf,
141                                size_t size, const char *name,
142                                enum nodemap_tree_type tree_type)
143 {
144         struct lu_nodemap      *nodemap;
145         struct obd_export      *exp = info->mti_exp;
146         int                     rc = size;
147
148         ENTRY;
149
150         if (strcmp(name, XATTR_NAME_ACL_ACCESS) == 0 ||
151             strcmp(name, XATTR_NAME_ACL_DEFAULT) == 0) {
152                 if (size > info->mti_mdt->mdt_max_ea_size ||
153                      (!exp_connect_large_acl(exp) &&
154                       size > LUSTRE_POSIX_ACL_MAX_SIZE_OLD))
155                         GOTO(out, rc = -ERANGE);
156
157                 nodemap = nodemap_get_from_exp(exp);
158                 if (IS_ERR(nodemap))
159                         GOTO(out, rc = PTR_ERR(nodemap));
160
161                 rc = nodemap_map_acl(nodemap, buf, size, tree_type);
162                 nodemap_putref(nodemap);
163                 if (rc < 0)
164                         GOTO(out, rc);
165         }
166 out:
167         RETURN(rc);
168 }
169
170 static int mdt_getxattr_all(struct mdt_thread_info *info,
171                             struct mdt_body *reqbody, struct mdt_body *repbody,
172                             struct lu_buf *buf, struct md_object *next)
173 {
174         const struct lu_env *env = info->mti_env;
175         char *v, *b, *eadatahead, *eadatatail;
176         __u32 *sizes;
177         int eadatasize, eavallen = 0, eavallens = 0, rc;
178
179         ENTRY;
180
181         /*
182          * The format of the pill is the following:
183          * EADATA:      attr1\0attr2\0...attrn\0
184          * EAVALS:      val1val2...valn
185          * EAVALS_LENS: 4,4,...4
186          */
187
188         eadatahead = buf->lb_buf;
189
190         /* Fill out EADATA first */
191         rc = mo_xattr_list(env, next, buf);
192         if (rc < 0)
193                 GOTO(out_shrink, rc);
194
195         eadatasize = rc;
196         eadatatail = eadatahead + eadatasize;
197
198         v = req_capsule_server_get(info->mti_pill, &RMF_EAVALS);
199         sizes = req_capsule_server_get(info->mti_pill, &RMF_EAVALS_LENS);
200
201         /* Fill out EAVALS and EAVALS_LENS */
202         for (b = eadatahead; b < eadatatail; b += strlen(b) + 1, v += rc) {
203                 buf->lb_buf = v;
204                 buf->lb_len = reqbody->mbo_eadatasize - eavallen;
205                 rc = mo_xattr_get(env, next, buf, b);
206                 if (rc < 0)
207                         GOTO(out_shrink, rc);
208                 rc = mdt_nodemap_map_acl(info, buf->lb_buf, rc, b,
209                                          NODEMAP_FS_TO_CLIENT);
210                 if (rc < 0)
211                         GOTO(out_shrink, rc);
212                 sizes[eavallens] = rc;
213                 eavallens++;
214                 eavallen += rc;
215         }
216
217 out_shrink:
218         if (rc < 0) {
219                 eadatasize = 0;
220                 eavallens = 0;
221                 eavallen = 0;
222         }
223         repbody->mbo_aclsize = eavallen;
224         repbody->mbo_max_mdsize = eavallens;
225
226         req_capsule_shrink(info->mti_pill, &RMF_EAVALS, eavallen, RCL_SERVER);
227         req_capsule_shrink(info->mti_pill, &RMF_EAVALS_LENS,
228                            eavallens * sizeof(__u32), RCL_SERVER);
229         req_capsule_shrink(info->mti_pill, &RMF_EADATA, eadatasize, RCL_SERVER);
230
231         if (rc >= 0)
232                 RETURN(eadatasize);
233         return rc;
234 }
235
236 int mdt_getxattr(struct mdt_thread_info *info)
237 {
238         struct ptlrpc_request  *req = mdt_info_req(info);
239         struct mdt_body        *reqbody;
240         struct mdt_body        *repbody = NULL;
241         struct md_object       *next;
242         struct lu_buf          *buf;
243         int                     easize, rc;
244         u64                     valid;
245         ENTRY;
246
247         LASSERT(info->mti_object != NULL);
248         LASSERT(lu_object_assert_exists(&info->mti_object->mot_obj));
249
250         CDEBUG(D_INODE, "getxattr "DFID"\n", PFID(&info->mti_body->mbo_fid1));
251
252         rc = req_check_sepol(info->mti_pill);
253         if (rc)
254                 RETURN(err_serious(rc));
255
256         reqbody = req_capsule_client_get(info->mti_pill, &RMF_MDT_BODY);
257         if (reqbody == NULL)
258                 RETURN(err_serious(-EFAULT));
259
260         rc = mdt_init_ucred(info, reqbody);
261         if (rc)
262                 RETURN(err_serious(rc));
263
264         next = mdt_object_child(info->mti_object);
265         easize = mdt_getxattr_pack_reply(info);
266         if (easize == -ENODATA)
267                 GOTO(out, rc = easize);
268         else if (easize < 0)
269                 GOTO(out, rc = err_serious(easize));
270
271         repbody = req_capsule_server_get(info->mti_pill, &RMF_MDT_BODY);
272         LASSERT(repbody != NULL);
273
274         /* No need further getxattr. */
275         if (easize == 0 || reqbody->mbo_eadatasize == 0)
276                 GOTO(out, rc = easize);
277
278         buf = &info->mti_buf;
279         buf->lb_buf = req_capsule_server_get(info->mti_pill, &RMF_EADATA);
280         buf->lb_len = easize;
281
282         valid = info->mti_body->mbo_valid & (OBD_MD_FLXATTR | OBD_MD_FLXATTRLS);
283
284         if (valid == OBD_MD_FLXATTR) {
285                 const char *xattr_name = req_capsule_client_get(info->mti_pill,
286                                                                 &RMF_NAME);
287                 rc = mo_xattr_get(info->mti_env, next, buf, xattr_name);
288                 if (rc < 0)
289                         GOTO(out, rc);
290
291                 rc = mdt_nodemap_map_acl(info, buf->lb_buf, rc, xattr_name,
292                                          NODEMAP_FS_TO_CLIENT);
293         } else if (valid == OBD_MD_FLXATTRLS) {
294                 CDEBUG(D_INODE, "listxattr\n");
295
296                 rc = mo_xattr_list(info->mti_env, next, buf);
297                 if (rc < 0)
298                         CDEBUG(D_INFO, "listxattr failed: %d\n", rc);
299         } else if (valid == OBD_MD_FLXATTRALL) {
300                 rc = mdt_getxattr_all(info, reqbody, repbody,
301                                       buf, next);
302         } else
303                 LBUG();
304
305         EXIT;
306 out:
307         if (rc >= 0) {
308                 mdt_counter_incr(req, LPROC_MDT_GETXATTR);
309                 /* LU-11109: Set OBD_MD_FLXATTR on success so that
310                  * newer clients can distinguish between nonexistent
311                  * xattrs and zero length values. */
312                 repbody->mbo_valid |= OBD_MD_FLXATTR;
313                 repbody->mbo_eadatasize = rc;
314                 rc = 0;
315         }
316         mdt_exit_ucred(info);
317         return rc;
318 }
319
320 /* update dir layout after migration/restripe */
321 static int mdt_dir_layout_update(struct mdt_thread_info *info)
322 {
323         const struct lu_env *env = info->mti_env;
324         struct mdt_device *mdt = info->mti_mdt;
325         struct lu_ucred *uc = mdt_ucred(info);
326         struct mdt_reint_record *rr = &info->mti_rr;
327         struct lmv_user_md *lmu = rr->rr_eadata;
328         __u32 lum_stripe_count = lmu->lum_stripe_count;
329         struct md_layout_change *mlc = &info->mti_mlc;
330         struct lmv_mds_md_v1 *lmv;
331         struct md_attr *ma = &info->mti_attr;
332         struct ldlm_enqueue_info *einfo = &info->mti_einfo[0];
333         struct mdt_object *pobj = NULL;
334         struct mdt_object *obj;
335         struct mdt_lock_handle *lhp = NULL;
336         struct mdt_lock_handle *lhc;
337         bool shrink = false;
338         int rc;
339
340         ENTRY;
341
342         if (!mdt->mdt_enable_dir_migration)
343                 RETURN(-EPERM);
344
345         if (!md_capable(uc, CFS_CAP_SYS_ADMIN) &&
346             uc->uc_gid != mdt->mdt_enable_remote_dir_gid &&
347             mdt->mdt_enable_remote_dir_gid != -1)
348                 RETURN(-EPERM);
349
350         /* mti_big_lmm is used to save LMV, but it may be uninitialized. */
351         if (unlikely(!info->mti_big_lmm)) {
352                 info->mti_big_lmmsize = lmv_mds_md_size(64, LMV_MAGIC);
353                 OBD_ALLOC(info->mti_big_lmm, info->mti_big_lmmsize);
354                 if (!info->mti_big_lmm)
355                         RETURN(-ENOMEM);
356         }
357
358         obj = mdt_object_find(env, mdt, rr->rr_fid1);
359         if (IS_ERR(obj))
360                 RETURN(PTR_ERR(obj));
361
362         /* get parent from PFID */
363         rc = mdt_attr_get_pfid(info, obj, &ma->ma_pfid);
364         if (rc)
365                 GOTO(put_obj, rc);
366
367         pobj = mdt_object_find(env, mdt, &ma->ma_pfid);
368         if (IS_ERR(pobj))
369                 GOTO(put_obj, rc = PTR_ERR(pobj));
370
371         /* revoke object remote LOOKUP lock */
372         if (mdt_object_remote(pobj)) {
373                 rc = mdt_revoke_remote_lookup_lock(info, pobj, obj);
374                 if (rc)
375                         GOTO(put_pobj, rc);
376         }
377
378         /*
379          * lock parent if dir will be shrunk to 1 stripe, because dir will be
380          * converted to normal directory, as will change dir FID and update
381          * namespace of parent.
382          */
383         lhp = &info->mti_lh[MDT_LH_PARENT];
384         mdt_lock_reg_init(lhp, LCK_PW);
385
386         if (le32_to_cpu(lmu->lum_stripe_count) < 2) {
387                 rc = mdt_reint_object_lock(info, pobj, lhp,
388                                            MDS_INODELOCK_UPDATE, true);
389                 if (rc)
390                         GOTO(put_pobj, rc);
391         }
392
393         /* lock object */
394         lhc = &info->mti_lh[MDT_LH_CHILD];
395         mdt_lock_reg_init(lhc, LCK_EX);
396         rc = mdt_reint_striped_lock(info, obj, lhc, MDS_INODELOCK_FULL, einfo,
397                                     true);
398         if (rc)
399                 GOTO(unlock_pobj, rc);
400
401         ma->ma_lmv = info->mti_big_lmm;
402         ma->ma_lmv_size = info->mti_big_lmmsize;
403         ma->ma_valid = 0;
404         rc = mdt_stripe_get(info, obj, ma, XATTR_NAME_LMV);
405         if (rc)
406                 GOTO(unlock_obj, rc);
407
408         /* user may run 'lfs migrate' multiple times, so it's shrunk already */
409         if (!(ma->ma_valid & MA_LMV))
410                 GOTO(unlock_obj, rc = -EALREADY);
411
412         lmv = &ma->ma_lmv->lmv_md_v1;
413         if (!lmv_is_sane(lmv))
414                 GOTO(unlock_obj, rc = -EBADF);
415
416         /* ditto */
417         if (!lmv_is_layout_changing(lmv))
418                 GOTO(unlock_obj, rc = -EALREADY);
419
420         lum_stripe_count = lmu->lum_stripe_count;
421         if (!lum_stripe_count)
422                 lum_stripe_count = cpu_to_le32(1);
423
424         if (lmv_is_migrating(lmv)) {
425                 if (lmv->lmv_migrate_offset != lum_stripe_count) {
426                         CERROR("%s: "DFID" migrate mdt count mismatch %u != %u\n",
427                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
428                                 lmv->lmv_migrate_offset, lmu->lum_stripe_count);
429                         GOTO(unlock_obj, rc = -EINVAL);
430                 }
431
432                 if (lmu->lum_stripe_offset != lmv->lmv_master_mdt_index) {
433                         CERROR("%s: "DFID" migrate mdt index mismatch %u != %u\n",
434                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
435                                 lmv->lmv_master_mdt_index,
436                                 lmu->lum_stripe_offset);
437                         GOTO(unlock_obj, rc = -EINVAL);
438                 }
439
440                 if (lum_stripe_count > 1 && lmu->lum_hash_type &&
441                     lmu->lum_hash_type !=
442                     (lmv->lmv_merge_hash & cpu_to_le32(LMV_HASH_TYPE_MASK))) {
443                         CERROR("%s: "DFID" migrate mdt hash mismatch %u != %u\n",
444                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
445                                 lmv->lmv_hash_type, lmu->lum_hash_type);
446                         GOTO(unlock_obj, rc = -EINVAL);
447                 }
448
449                 shrink = true;
450         } else if (lmv_is_splitting(lmv)) {
451                 if (lmv->lmv_stripe_count != lum_stripe_count) {
452                         CERROR("%s: "DFID" stripe count mismatch %u != %u\n",
453                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
454                                 lmv->lmv_stripe_count, lmu->lum_stripe_count);
455                         GOTO(unlock_obj, rc = -EINVAL);
456                 }
457
458                 if (lmu->lum_stripe_offset != LMV_OFFSET_DEFAULT) {
459                         CERROR("%s: "DFID" dir split offset %u != -1\n",
460                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
461                                 lmu->lum_stripe_offset);
462                         GOTO(unlock_obj, rc = -EINVAL);
463                 }
464
465                 if (lmu->lum_hash_type &&
466                     lmu->lum_hash_type !=
467                     (lmv->lmv_hash_type & cpu_to_le32(LMV_HASH_TYPE_MASK))) {
468                         CERROR("%s: "DFID" split hash mismatch %u != %u\n",
469                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
470                                 lmv->lmv_hash_type, lmu->lum_hash_type);
471                         GOTO(unlock_obj, rc = -EINVAL);
472                 }
473         } else if (lmv_is_merging(lmv)) {
474                 if (lmv->lmv_merge_offset != lum_stripe_count) {
475                         CERROR("%s: "DFID" stripe count mismatch %u != %u\n",
476                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
477                                 lmv->lmv_merge_offset, lmu->lum_stripe_count);
478                         GOTO(unlock_obj, rc = -EINVAL);
479                 }
480
481                 if (lmu->lum_stripe_offset != LMV_OFFSET_DEFAULT) {
482                         CERROR("%s: "DFID" dir split offset %u != -1\n",
483                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
484                                 lmu->lum_stripe_offset);
485                         GOTO(unlock_obj, rc = -EINVAL);
486                 }
487
488                 if (lmu->lum_hash_type &&
489                     lmu->lum_hash_type !=
490                     (lmv->lmv_merge_hash & cpu_to_le32(LMV_HASH_TYPE_MASK))) {
491                         CERROR("%s: "DFID" split hash mismatch %u != %u\n",
492                                 mdt_obd_name(info->mti_mdt), PFID(rr->rr_fid1),
493                                 lmv->lmv_merge_hash, lmu->lum_hash_type);
494                         GOTO(unlock_obj, rc = -EINVAL);
495                 }
496
497                 if (lum_stripe_count < lmv->lmv_stripe_count)
498                         shrink = true;
499         }
500
501         if (shrink) {
502                 mlc->mlc_opc = MD_LAYOUT_SHRINK;
503                 mlc->mlc_buf.lb_buf = rr->rr_eadata;
504                 mlc->mlc_buf.lb_len = rr->rr_eadatalen;
505                 rc = mo_layout_change(env, mdt_object_child(obj), mlc);
506         } else {
507                 struct lu_buf *buf = &info->mti_buf;
508                 u32 version = le32_to_cpu(lmv->lmv_layout_version);
509
510                 lmv->lmv_hash_type &= ~LMV_HASH_FLAG_LAYOUT_CHANGE;
511                 lmv->lmv_layout_version = cpu_to_le32(++version);
512                 buf->lb_buf = lmv;
513                 buf->lb_len = sizeof(*lmv);
514                 rc = mo_xattr_set(env, mdt_object_child(obj), buf,
515                                   XATTR_NAME_LMV, LU_XATTR_REPLACE);
516         }
517         GOTO(unlock_obj, rc);
518
519 unlock_obj:
520         mdt_reint_striped_unlock(info, obj, lhc, einfo, rc);
521 unlock_pobj:
522         mdt_object_unlock(info, pobj, lhp, rc);
523 put_pobj:
524         mdt_object_put(env, pobj);
525 put_obj:
526         mdt_object_put(env, obj);
527
528         return rc;
529 }
530
531 int mdt_reint_setxattr(struct mdt_thread_info *info,
532                        struct mdt_lock_handle *unused)
533 {
534         struct ptlrpc_request   *req = mdt_info_req(info);
535         struct mdt_lock_handle  *lh;
536         const struct lu_env     *env  = info->mti_env;
537         struct lu_buf           *buf  = &info->mti_buf;
538         struct mdt_reint_record *rr   = &info->mti_rr;
539         struct md_attr          *ma = &info->mti_attr;
540         struct lu_attr          *attr = &info->mti_attr.ma_attr;
541         struct mdt_object       *obj;
542         struct md_object        *child;
543         __u64                    valid = attr->la_valid;
544         const char              *xattr_name = rr->rr_name.ln_name;
545         int                      xattr_len = rr->rr_eadatalen;
546         __u64                    lockpart = MDS_INODELOCK_UPDATE;
547         int                      rc;
548         ENTRY;
549
550         CDEBUG(D_INODE, "setxattr for "DFID": %s %s\n", PFID(rr->rr_fid1),
551                valid & OBD_MD_FLXATTR ? "set" : "remove", xattr_name);
552
553         if (info->mti_dlm_req)
554                 ldlm_request_cancel(req, info->mti_dlm_req, 0, LATF_SKIP);
555
556         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_SETXATTR))
557                 RETURN(err_serious(-ENOMEM));
558
559         rc = mdt_init_ucred_reint(info);
560         if (rc != 0)
561                 RETURN(rc);
562
563         if (strncmp(xattr_name, XATTR_USER_PREFIX,
564                     sizeof(XATTR_USER_PREFIX) - 1) == 0) {
565                 if (!(exp_connect_flags(req->rq_export) & OBD_CONNECT_XATTR))
566                         GOTO(out, rc = -EOPNOTSUPP);
567         } else if (strncmp(xattr_name, XATTR_TRUSTED_PREFIX,
568                     sizeof(XATTR_TRUSTED_PREFIX) - 1) == 0) {
569
570                 /* setxattr(LMV) with lum is used to shrink dir layout */
571                 if (strcmp(xattr_name, XATTR_NAME_LMV) == 0) {
572                         __u32 *magic = rr->rr_eadata;
573
574                         /* we don't let to remove LMV? */
575                         if (!rr->rr_eadata)
576                                 GOTO(out, rc = 0);
577
578                         if (le32_to_cpu(*magic) == LMV_USER_MAGIC ||
579                             le32_to_cpu(*magic) == LMV_USER_MAGIC_SPECIFIC) {
580                                 rc = mdt_dir_layout_update(info);
581                                 GOTO(out, rc);
582                         }
583                 }
584
585                 if (!md_capable(mdt_ucred(info), CFS_CAP_SYS_ADMIN))
586                         GOTO(out, rc = -EPERM);
587
588                 if (strcmp(xattr_name, XATTR_NAME_LOV) == 0 ||
589                     strcmp(xattr_name, XATTR_NAME_LMA) == 0 ||
590                     strcmp(xattr_name, XATTR_NAME_LMV) == 0 ||
591                     strcmp(xattr_name, XATTR_NAME_LINK) == 0 ||
592                     strcmp(xattr_name, XATTR_NAME_FID) == 0 ||
593                     strcmp(xattr_name, XATTR_NAME_VERSION) == 0 ||
594                     strcmp(xattr_name, XATTR_NAME_SOM) == 0 ||
595                     strcmp(xattr_name, XATTR_NAME_HSM) == 0 ||
596                     strcmp(xattr_name, XATTR_NAME_LFSCK_NAMESPACE) == 0)
597                         GOTO(out, rc = 0);
598         } else if ((valid & OBD_MD_FLXATTR) &&
599                    (strcmp(xattr_name, XATTR_NAME_ACL_ACCESS) == 0 ||
600                     strcmp(xattr_name, XATTR_NAME_ACL_DEFAULT) == 0)) {
601                 rc = mdt_nodemap_map_acl(info, rr->rr_eadata, xattr_len,
602                                          xattr_name, NODEMAP_CLIENT_TO_FS);
603                 if (rc < 0)
604                         GOTO(out, rc);
605                 /* ACLs were mapped out, return an error so the user knows */
606                 if (rc != xattr_len)
607                         GOTO(out, rc = -EPERM);
608         } else if ((strlen(xattr_name) > sizeof(XATTR_LUSTRE_LOV)) &&
609                    strncmp(xattr_name, XATTR_LUSTRE_LOV,
610                            strlen(XATTR_LUSTRE_LOV)) == 0) {
611
612                 if (!allowed_lustre_lov(xattr_name)) {
613                         CERROR("%s: invalid xattr name: %s\n",
614                                mdt_obd_name(info->mti_mdt), xattr_name);
615                         GOTO(out, rc = -EINVAL);
616                 }
617
618                 lockpart |= MDS_INODELOCK_LAYOUT;
619         }
620
621         /* Revoke all clients' lookup lock, since the access
622          * permissions for this inode is changed when ACL_ACCESS is
623          * set. This isn't needed for ACL_DEFAULT, since that does
624          * not change the access permissions of this inode, nor any
625          * other existing inodes. It is setting the ACLs inherited
626          * by new directories/files at create time. */
627         /* We need revoke both LOOKUP|PERM lock here, see mdt_attr_set. */
628         if (!strcmp(xattr_name, XATTR_NAME_ACL_ACCESS))
629                 lockpart |= MDS_INODELOCK_PERM | MDS_INODELOCK_LOOKUP;
630         /* We need to take the lock on behalf of old clients so that newer
631          * clients flush their xattr caches */
632         else
633                 lockpart |= MDS_INODELOCK_XATTR;
634
635         lh = &info->mti_lh[MDT_LH_PARENT];
636         /* ACLs were sent to clients under LCK_CR locks, so taking LCK_EX
637          * to cancel them. */
638         mdt_lock_reg_init(lh, LCK_EX);
639         obj = mdt_object_find_lock(info, rr->rr_fid1, lh, lockpart);
640         if (IS_ERR(obj))
641                 GOTO(out, rc = PTR_ERR(obj));
642
643         tgt_vbr_obj_set(env, mdt_obj2dt(obj));
644         rc = mdt_version_get_check_save(info, obj, 0);
645         if (rc)
646                 GOTO(out_unlock, rc);
647
648         if (unlikely(!(valid & OBD_MD_FLCTIME))) {
649                 /* This isn't strictly an error, but all current clients
650                  * should set OBD_MD_FLCTIME when setting attributes. */
651                 CWARN("%s: client miss to set OBD_MD_FLCTIME when "
652                       "setxattr %s: [object "DFID"] [valid %llu]\n",
653                       mdt_obd_name(info->mti_mdt), xattr_name,
654                       PFID(rr->rr_fid1), valid);
655                 attr->la_ctime = ktime_get_real_seconds();
656         }
657         attr->la_valid = LA_CTIME;
658         child = mdt_object_child(obj);
659         if (valid & OBD_MD_FLXATTR) {
660                 int     flags = 0;
661
662                 if (attr->la_flags & XATTR_REPLACE)
663                         flags |= LU_XATTR_REPLACE;
664
665                 if (attr->la_flags & XATTR_CREATE)
666                         flags |= LU_XATTR_CREATE;
667
668                 mdt_fail_write(env, info->mti_mdt->mdt_bottom,
669                                OBD_FAIL_MDS_SETXATTR_WRITE);
670
671                 buf->lb_buf = rr->rr_eadata;
672                 buf->lb_len = xattr_len;
673                 rc = mo_xattr_set(env, child, buf, xattr_name, flags);
674                 /* update ctime after xattr changed */
675                 if (rc == 0) {
676                         ma->ma_attr_flags |= MDS_PERM_BYPASS;
677                         mo_attr_set(env, child, ma);
678                 }
679         } else if (valid & OBD_MD_FLXATTRRM) {
680                 rc = mo_xattr_del(env, child, xattr_name);
681                 /* update ctime after xattr changed */
682                 if (rc == 0) {
683                         ma->ma_attr_flags |= MDS_PERM_BYPASS;
684                         mo_attr_set(env, child, ma);
685                 }
686         } else {
687                 CDEBUG(D_INFO, "valid bits: %#llx\n", valid);
688                 rc = -EINVAL;
689         }
690
691         if (rc == 0)
692                 mdt_counter_incr(req, LPROC_MDT_SETXATTR);
693
694         EXIT;
695 out_unlock:
696         mdt_object_unlock_put(info, obj, lh, rc);
697 out:
698         mdt_exit_ucred(info);
699         return rc;
700 }