Whamcloud - gitweb
LU-9344 test: hung with sendfile_grouplock test12()
[fs/lustre-release.git] / lustre / llite / xattr.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2011, 2016, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  */
32
33 #include <linux/fs.h>
34 #include <linux/sched.h>
35 #include <linux/mm.h>
36 #include <linux/xattr.h>
37 #include <linux/selinux.h>
38
39 #define DEBUG_SUBSYSTEM S_LLITE
40
41 #include <obd_support.h>
42 #include <lustre_dlm.h>
43 #include <lustre_ver.h>
44 #include <lustre_eacl.h>
45
46 #include "llite_internal.h"
47
48 /* xattr related to IMA(Integrity Measurement Architecture) */
49 #ifndef XATTR_NAME_IMA
50 #define XATTR_NAME_IMA          "security.ima"
51 #endif
52 #ifndef XATTR_NAME_EVM
53 #define XATTR_NAME_EVM          "security.evm"
54 #endif
55
56 #define XATTR_USER_T            (1)
57 #define XATTR_TRUSTED_T         (2)
58 #define XATTR_SECURITY_T        (3)
59 #define XATTR_ACL_ACCESS_T      (4)
60 #define XATTR_ACL_DEFAULT_T     (5)
61 #define XATTR_LUSTRE_T          (6)
62 #define XATTR_OTHER_T           (7)
63
64 static
65 int get_xattr_type(const char *name)
66 {
67         if (!strcmp(name, XATTR_NAME_POSIX_ACL_ACCESS))
68                 return XATTR_ACL_ACCESS_T;
69
70         if (!strcmp(name, XATTR_NAME_POSIX_ACL_DEFAULT))
71                 return XATTR_ACL_DEFAULT_T;
72
73         if (!strncmp(name, XATTR_USER_PREFIX,
74                      sizeof(XATTR_USER_PREFIX) - 1))
75                 return XATTR_USER_T;
76
77         if (!strncmp(name, XATTR_TRUSTED_PREFIX,
78                      sizeof(XATTR_TRUSTED_PREFIX) - 1))
79                 return XATTR_TRUSTED_T;
80
81         if (!strncmp(name, XATTR_SECURITY_PREFIX,
82                      sizeof(XATTR_SECURITY_PREFIX) - 1))
83                 return XATTR_SECURITY_T;
84
85         if (!strncmp(name, XATTR_LUSTRE_PREFIX,
86                      sizeof(XATTR_LUSTRE_PREFIX) - 1))
87                 return XATTR_LUSTRE_T;
88
89         return XATTR_OTHER_T;
90 }
91
92 static
93 int xattr_type_filter(struct ll_sb_info *sbi, int xattr_type)
94 {
95         if ((xattr_type == XATTR_ACL_ACCESS_T ||
96              xattr_type == XATTR_ACL_DEFAULT_T) &&
97            !(sbi->ll_flags & LL_SBI_ACL))
98                 return -EOPNOTSUPP;
99
100         if (xattr_type == XATTR_USER_T && !(sbi->ll_flags & LL_SBI_USER_XATTR))
101                 return -EOPNOTSUPP;
102         if (xattr_type == XATTR_TRUSTED_T && !cfs_capable(CFS_CAP_SYS_ADMIN))
103                 return -EPERM;
104         if (xattr_type == XATTR_OTHER_T)
105                 return -EOPNOTSUPP;
106
107         return 0;
108 }
109
110 static
111 int ll_setxattr_common(struct inode *inode, const char *name,
112                        const void *value, size_t size,
113                        int flags, __u64 valid)
114 {
115         struct ll_sb_info *sbi = ll_i2sbi(inode);
116         struct ptlrpc_request *req = NULL;
117         int xattr_type, rc;
118         const char *pv = value;
119         ENTRY;
120
121         /*FIXME: enable IMA when the conditions are ready */
122         if (strncmp(name, XATTR_NAME_IMA,
123                     sizeof(XATTR_NAME_IMA)) == 0 ||
124             strncmp(name, XATTR_NAME_EVM,
125                     sizeof(XATTR_NAME_EVM)) == 0)
126                 return -EOPNOTSUPP;
127
128         xattr_type = get_xattr_type(name);
129         rc = xattr_type_filter(sbi, xattr_type);
130         if (rc)
131                 RETURN(rc);
132
133         if ((xattr_type == XATTR_ACL_ACCESS_T ||
134              xattr_type == XATTR_ACL_DEFAULT_T) &&
135 #ifdef HAVE_INODE_OWNER_OR_CAPABLE
136             !inode_owner_or_capable(inode))
137 #else
138             !is_owner_or_cap(inode))
139 #endif
140                 return -EPERM;
141
142         /* b10667: ignore lustre special xattr for now */
143         if (strcmp(name, XATTR_NAME_HSM) == 0 ||
144                 (xattr_type == XATTR_TRUSTED_T &&
145                 strcmp(name, XATTR_NAME_LOV) == 0) ||
146                 (xattr_type == XATTR_LUSTRE_T &&
147                  strcmp(name, "lustre.lov") == 0))
148                 RETURN(0);
149
150         /* b15587: ignore security.capability xattr for now */
151         if ((xattr_type == XATTR_SECURITY_T &&
152             strcmp(name, "security.capability") == 0))
153                 RETURN(0);
154
155         /* LU-549:  Disable security.selinux when selinux is disabled */
156         if (xattr_type == XATTR_SECURITY_T && !selinux_is_enabled() &&
157             strcmp(name, "security.selinux") == 0)
158                 RETURN(-EOPNOTSUPP);
159
160         /* In user.* namespace, only regular files and directories can have
161          * extended attributes. */
162         if (xattr_type == XATTR_USER_T) {
163                 if (!S_ISREG(inode->i_mode) && !S_ISDIR(inode->i_mode))
164                         RETURN(-EPERM);
165         }
166
167         rc = md_setxattr(sbi->ll_md_exp, ll_inode2fid(inode), valid, name, pv,
168                          size, 0, flags, ll_i2suppgid(inode), &req);
169         if (rc) {
170                 if (rc == -EOPNOTSUPP && xattr_type == XATTR_USER_T) {
171                         LCONSOLE_INFO("Disabling user_xattr feature because "
172                                       "it is not supported on the server\n");
173                         sbi->ll_flags &= ~LL_SBI_USER_XATTR;
174                 }
175                 RETURN(rc);
176         }
177
178         ptlrpc_req_finished(req);
179         RETURN(0);
180 }
181
182 static int get_hsm_state(struct inode *inode, __u32 *hus_states)
183 {
184         struct md_op_data *op_data;
185         struct hsm_user_state *hus;
186         int rc;
187
188         OBD_ALLOC_PTR(hus);
189         if (hus == NULL)
190                 return -ENOMEM;
191
192         op_data = ll_prep_md_op_data(NULL, inode, NULL, NULL, 0, 0,
193                                      LUSTRE_OPC_ANY, hus);
194         if (!IS_ERR(op_data)) {
195                 rc = obd_iocontrol(LL_IOC_HSM_STATE_GET, ll_i2mdexp(inode),
196                                    sizeof(*op_data), op_data, NULL);
197                 if (rc == 0)
198                         *hus_states = hus->hus_states;
199                 else
200                         CDEBUG(D_VFSTRACE, "obd_iocontrol failed. rc = %d\n",
201                                rc);
202
203                 ll_finish_md_op_data(op_data);
204         } else {
205                 rc = PTR_ERR(op_data);
206                 CDEBUG(D_VFSTRACE, "Could not prepare the opdata. rc = %d\n",
207                        rc);
208         }
209         OBD_FREE_PTR(hus);
210         return rc;
211 }
212 int ll_setstripe_ea(struct dentry *dentry, struct lov_user_md *lump,
213                     size_t size)
214 {
215         struct inode *inode = dentry->d_inode;
216         int rc = 0;
217         bool return_err = false;
218
219         if (lump != NULL && lump->lmm_magic == LOV_USER_MAGIC_COMP_V1) {
220                 return_err = true;
221                 goto setstripe;
222         }
223
224         /* Attributes that are saved via getxattr will always have
225          * the stripe_offset as 0.  Instead, the MDS should be
226          * allowed to pick the starting OST index.   b=17846 */
227         if (lump != NULL && lump->lmm_stripe_offset == 0)
228                 lump->lmm_stripe_offset = -1;
229         /* Avoid anyone directly setting the RELEASED flag. */
230         if (lump != NULL &&
231                 (lump->lmm_pattern & LOV_PATTERN_F_RELEASED)) {
232                 /* Only if we have a released flag check if the file
233                 * was indeed archived. */
234                 __u32 state = HS_NONE;
235                 rc = get_hsm_state(inode, &state);
236                 if (rc != 0)
237                         RETURN(rc);
238                 if (!(state & HS_ARCHIVED)) {
239                         CDEBUG(D_VFSTRACE,
240                                 "hus_states state = %x, pattern = %x\n",
241                                 state, lump->lmm_pattern);
242                         /* Here the state is: real file is not
243                          * archived but user is requesting to set
244                          * the RELEASED flag so we mask off the
245                          * released flag from the request */
246                         lump->lmm_pattern ^= LOV_PATTERN_F_RELEASED;
247                 }
248         }
249
250 setstripe:
251         if (lump != NULL && S_ISREG(inode->i_mode)) {
252                 struct file     f;
253                 __u64           it_flags = FMODE_WRITE;
254                 int             lum_size;
255
256                 lum_size = ll_lov_user_md_size(lump);
257                 /**
258                  * b=10667: ignore error.
259                  * Silently eat error on setting strusted.lov attribute for
260                  * SuSE 9, it added default option to copy all attributes in
261                  * 'cp' command.
262                  */
263                 if (lum_size < 0 || size < lum_size)
264                         return return_err ? -ERANGE : 0;
265
266                 memset(&f, 0, sizeof(f)); /* f.f_flags is used below */
267                 f.f_path.dentry = dentry;
268                 rc = ll_lov_setstripe_ea_info(inode, &f, it_flags, lump,
269                                               lum_size);
270                 /* b=10667 */
271                 if (!return_err)
272                         rc = 0;
273         } else if (S_ISDIR(inode->i_mode)) {
274                 rc = ll_dir_setstripe(inode, lump, 0);
275         }
276
277         return rc;
278 }
279
280 int ll_setxattr(struct dentry *dentry, const char *name,
281                 const void *value, size_t size, int flags)
282 {
283         struct inode *inode = dentry->d_inode;
284
285         LASSERT(inode);
286         LASSERT(name);
287
288         CDEBUG(D_VFSTRACE, "VFS Op:inode="DFID"(%p), xattr %s\n",
289                PFID(ll_inode2fid(inode)), inode, name);
290
291         ll_stats_ops_tally(ll_i2sbi(inode), LPROC_LL_SETXATTR, 1);
292
293         /* lustre/trusted.lov.xxx would be passed through xattr API */
294         if (strcmp(name, XATTR_NAME_LOV) == 0 ||
295             strcmp(name, XATTR_LUSTRE_LOV) == 0)
296                 return ll_setstripe_ea(dentry, (struct lov_user_md *)value,
297                                        size);
298         else if (strcmp(name, XATTR_NAME_LMA) == 0 ||
299                  strcmp(name, XATTR_NAME_LINK) == 0)
300                 return 0;
301
302         return ll_setxattr_common(inode, name, value, size, flags,
303                                   OBD_MD_FLXATTR);
304 }
305
306 int ll_removexattr(struct dentry *dentry, const char *name)
307 {
308         struct inode *inode = dentry->d_inode;
309
310         LASSERT(inode);
311         LASSERT(name);
312
313         CDEBUG(D_VFSTRACE, "VFS Op:inode="DFID"(%p), xattr %s\n",
314                PFID(ll_inode2fid(inode)), inode, name);
315
316         ll_stats_ops_tally(ll_i2sbi(inode), LPROC_LL_REMOVEXATTR, 1);
317         return ll_setxattr_common(inode, name, NULL, 0, 0,
318                                   OBD_MD_FLXATTRRM);
319 }
320
321 int ll_getxattr_common(struct inode *inode, const char *name,
322                        void *buffer, size_t size, __u64 valid)
323 {
324         struct ll_sb_info *sbi = ll_i2sbi(inode);
325         struct ptlrpc_request *req = NULL;
326         struct mdt_body *body;
327         int xattr_type, rc;
328         void *xdata;
329         struct ll_inode_info *lli = ll_i2info(inode);
330         ENTRY;
331
332         CDEBUG(D_VFSTRACE, "VFS Op:inode="DFID"(%p)\n",
333                PFID(ll_inode2fid(inode)), inode);
334
335         /* listxattr have slightly different behavior from of ext3:
336          * without 'user_xattr' ext3 will list all xattr names but
337          * filtered out "^user..*"; we list them all for simplicity.
338          */
339         if (!name) {
340                 xattr_type = XATTR_OTHER_T;
341                 goto do_getxattr;
342         }
343
344         xattr_type = get_xattr_type(name);
345         rc = xattr_type_filter(sbi, xattr_type);
346         if (rc)
347                 RETURN(rc);
348
349         /* b15587: ignore security.capability xattr for now */
350         if ((xattr_type == XATTR_SECURITY_T &&
351             strcmp(name, "security.capability") == 0))
352                 RETURN(-ENODATA);
353
354         /* LU-549:  Disable security.selinux when selinux is disabled */
355         if (xattr_type == XATTR_SECURITY_T && !selinux_is_enabled() &&
356             strcmp(name, "security.selinux") == 0)
357                 RETURN(-EOPNOTSUPP);
358
359 #ifdef CONFIG_FS_POSIX_ACL
360         /* posix acl is under protection of LOOKUP lock. when calling to this,
361          * we just have path resolution to the target inode, so we have great
362          * chance that cached ACL is uptodate.
363          */
364         if (xattr_type == XATTR_ACL_ACCESS_T) {
365                 struct posix_acl *acl;
366
367                 spin_lock(&lli->lli_lock);
368                 acl = posix_acl_dup(lli->lli_posix_acl);
369                 spin_unlock(&lli->lli_lock);
370
371                 if (!acl)
372                         RETURN(-ENODATA);
373
374                 rc = posix_acl_to_xattr(&init_user_ns, acl, buffer, size);
375                 posix_acl_release(acl);
376                 RETURN(rc);
377         }
378         if (xattr_type == XATTR_ACL_DEFAULT_T && !S_ISDIR(inode->i_mode))
379                 RETURN(-ENODATA);
380 #endif
381
382 do_getxattr:
383         if (sbi->ll_xattr_cache_enabled &&
384             xattr_type != XATTR_ACL_ACCESS_T &&
385             (xattr_type != XATTR_SECURITY_T ||
386                 strcmp(name, "security.selinux") != 0)) {
387                 rc = ll_xattr_cache_get(inode, name, buffer, size, valid);
388                 if (rc == -EAGAIN)
389                         goto getxattr_nocache;
390                 if (rc < 0)
391                         GOTO(out_xattr, rc);
392
393                 /* Add "system.posix_acl_access" to the list */
394                 if (lli->lli_posix_acl != NULL && valid & OBD_MD_FLXATTRLS) {
395                         if (size == 0) {
396                                 rc += sizeof(XATTR_NAME_ACL_ACCESS);
397                         } else if (size - rc >= sizeof(XATTR_NAME_ACL_ACCESS)) {
398                                 memcpy(buffer + rc, XATTR_NAME_ACL_ACCESS,
399                                        sizeof(XATTR_NAME_ACL_ACCESS));
400                                 rc += sizeof(XATTR_NAME_ACL_ACCESS);
401                         } else {
402                                 GOTO(out_xattr, rc = -ERANGE);
403                         }
404                 }
405         } else {
406 getxattr_nocache:
407                 rc = md_getxattr(sbi->ll_md_exp, ll_inode2fid(inode),
408                                 valid, name, NULL, 0, size, 0, &req);
409
410                 if (rc < 0)
411                         GOTO(out_xattr, rc);
412
413                 body = req_capsule_server_get(&req->rq_pill, &RMF_MDT_BODY);
414                 LASSERT(body);
415
416                 /* only detect the xattr size */
417                 if (size == 0)
418                         GOTO(out, rc = body->mbo_eadatasize);
419
420                 if (size < body->mbo_eadatasize) {
421                         CERROR("server bug: replied size %u > %u\n",
422                                 body->mbo_eadatasize, (int)size);
423                         GOTO(out, rc = -ERANGE);
424                 }
425
426                 if (body->mbo_eadatasize == 0)
427                         GOTO(out, rc = -ENODATA);
428
429                 /* do not need swab xattr data */
430                 xdata = req_capsule_server_sized_get(&req->rq_pill, &RMF_EADATA,
431                                                         body->mbo_eadatasize);
432                 if (!xdata)
433                         GOTO(out, rc = -EFAULT);
434
435                 memcpy(buffer, xdata, body->mbo_eadatasize);
436                 rc = body->mbo_eadatasize;
437         }
438
439         EXIT;
440
441 out_xattr:
442         if (rc == -EOPNOTSUPP && xattr_type == XATTR_USER_T) {
443                 LCONSOLE_INFO("%s: disabling user_xattr feature because "
444                                 "it is not supported on the server: rc = %d\n",
445                                 ll_get_fsname(inode->i_sb, NULL, 0), rc);
446                 sbi->ll_flags &= ~LL_SBI_USER_XATTR;
447         }
448 out:
449         ptlrpc_req_finished(req);
450         return rc;
451 }
452
453 static ssize_t ll_getxattr_lov(struct inode *inode, void *buf, size_t buf_size)
454 {
455         ssize_t rc;
456
457         if (S_ISREG(inode->i_mode)) {
458                 struct cl_object *obj = ll_i2info(inode)->lli_clob;
459                 struct lu_env *env;
460                 struct cl_layout cl = {
461                         .cl_buf.lb_buf = buf,
462                         .cl_buf.lb_len = buf_size,
463                 };
464                 __u16 refcheck;
465
466                 if (obj == NULL)
467                         RETURN(-ENODATA);
468
469                 env = cl_env_get(&refcheck);
470                 if (IS_ERR(env))
471                         RETURN(PTR_ERR(env));
472
473                 rc = cl_object_layout_get(env, obj, &cl);
474                 if (rc < 0)
475                         GOTO(out_env, rc);
476
477                 if (cl.cl_size == 0)
478                         GOTO(out_env, rc = -ENODATA);
479
480                 rc = cl.cl_size;
481
482                 if (buf_size == 0)
483                         GOTO(out_env, rc);
484
485                 LASSERT(buf != NULL && rc <= buf_size);
486
487                 /* Do not return layout gen for getxattr() since
488                  * otherwise it would confuse tar --xattr by
489                  * recognizing layout gen as stripe offset when the
490                  * file is restored. See LU-2809. */
491                 if (((struct lov_mds_md *)buf)->lmm_magic == LOV_MAGIC_COMP_V1)
492                         goto out_env;
493
494                 ((struct lov_mds_md *)buf)->lmm_layout_gen = 0;
495 out_env:
496                 cl_env_put(env, &refcheck);
497
498                 RETURN(rc);
499         } else if (S_ISDIR(inode->i_mode)) {
500                 struct lov_mds_md *lmm = NULL;
501                 int lmm_size = 0;
502                 struct ptlrpc_request *req = NULL;
503
504                 rc = ll_dir_getstripe(inode, (void **)&lmm, &lmm_size,
505                                       &req, 0);
506                 if (rc < 0)
507                         GOTO(out_req, rc);
508
509                 if (buf_size == 0)
510                         GOTO(out_req, rc = lmm_size);
511
512                 if (buf_size < lmm_size)
513                         GOTO(out_req, rc = -ERANGE);
514
515                 memcpy(buf, lmm, lmm_size);
516                 GOTO(out_req, rc = lmm_size);
517 out_req:
518                 if (req != NULL)
519                         ptlrpc_req_finished(req);
520
521                 return rc;
522         } else {
523                 RETURN(-ENODATA);
524         }
525 }
526
527 ssize_t ll_getxattr(struct dentry *dentry, const char *name, void *buf,
528                     size_t buf_size)
529 {
530         struct inode *inode = dentry->d_inode;
531
532         LASSERT(inode);
533         LASSERT(name);
534
535         CDEBUG(D_VFSTRACE, "VFS Op:inode="DFID"(%p), xattr %s\n",
536                PFID(ll_inode2fid(inode)), inode, name);
537
538         ll_stats_ops_tally(ll_i2sbi(inode), LPROC_LL_GETXATTR, 1);
539
540         if (strcmp(name, XATTR_LUSTRE_LOV) == 0 ||
541             strcmp(name, XATTR_NAME_LOV) == 0)
542                 return ll_getxattr_lov(inode, buf, buf_size);
543         else
544                 return ll_getxattr_common(inode, name, buf, buf_size,
545                                           OBD_MD_FLXATTR);
546 }
547
548 ssize_t ll_listxattr(struct dentry *dentry, char *buf, size_t buf_size)
549 {
550         struct inode *inode = dentry->d_inode;
551         struct ll_sb_info *sbi = ll_i2sbi(inode);
552         char *xattr_name;
553         ssize_t rc, rc2;
554         size_t len, rem;
555
556         CDEBUG(D_VFSTRACE, "VFS Op:inode="DFID"(%p)\n",
557                PFID(ll_inode2fid(inode)), inode);
558
559         ll_stats_ops_tally(ll_i2sbi(inode), LPROC_LL_LISTXATTR, 1);
560
561         rc = ll_getxattr_common(inode, NULL, buf, buf_size, OBD_MD_FLXATTRLS);
562         if (rc < 0)
563                 RETURN(rc);
564
565         /* If we're being called to get the size of the xattr list
566          * (buf_size == 0) then just assume that a lustre.lov xattr
567          * exists. */
568         if (buf_size == 0)
569                 RETURN(rc + sizeof(XATTR_LUSTRE_LOV));
570
571         xattr_name = buf;
572         rem = rc;
573
574         while (rem > 0) {
575                 len = strnlen(xattr_name, rem - 1) + 1;
576                 rem -= len;
577                 if (xattr_type_filter(sbi, get_xattr_type(xattr_name)) == 0) {
578                         /* Skip OK xattr type, leave it in buffer. */
579                         xattr_name += len;
580                         continue;
581                 }
582
583                 /* Move up remaining xattrs in buffer removing the
584                  * xattr that is not OK. */
585                 memmove(xattr_name, xattr_name + len, rem);
586                 rc -= len;
587         }
588
589         rc2 = ll_getxattr_lov(inode, NULL, 0);
590         if (rc2 == -ENODATA)
591                 RETURN(rc);
592
593         if (rc2 < 0)
594                 RETURN(rc2);
595
596         if (buf_size < rc + sizeof(XATTR_LUSTRE_LOV))
597                 RETURN(-ERANGE);
598
599         memcpy(buf + rc, XATTR_LUSTRE_LOV, sizeof(XATTR_LUSTRE_LOV));
600
601         RETURN(rc + sizeof(XATTR_LUSTRE_LOV));
602 }