Whamcloud - gitweb
aaa94abb6f926d0eb27c0be7c8412fafcff1eaf4
[fs/lustre-release.git] / lustre / osd-zfs / osd_xattr.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2009, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2012, 2016, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/osd-zfs/osd_xattr.c
33  * functions to manipulate extended attributes and system attributes
34  *
35  * Author: Alex Zhuravlev <bzzz@whamcloud.com>
36  * Author: Mike Pershin <tappro@whamcloud.com>
37  */
38
39 #define DEBUG_SUBSYSTEM S_OSD
40
41 #include <libcfs/libcfs.h>
42 #include <obd_support.h>
43 #include <lustre_net.h>
44 #include <obd.h>
45 #include <obd_class.h>
46 #include <lustre_disk.h>
47 #include <lustre_fid.h>
48
49 #include "osd_internal.h"
50
51 #include <sys/dnode.h>
52 #include <sys/dbuf.h>
53 #include <sys/spa.h>
54 #include <sys/stat.h>
55 #include <sys/zap.h>
56 #include <sys/spa_impl.h>
57 #include <sys/zfs_znode.h>
58 #include <sys/dmu_tx.h>
59 #include <sys/dmu_objset.h>
60 #include <sys/dsl_prop.h>
61 #include <sys/sa_impl.h>
62 #include <sys/txg.h>
63
64 #include <linux/posix_acl_xattr.h>
65
66
67 int __osd_xattr_load(struct osd_device *osd, sa_handle_t *hdl, nvlist_t **sa)
68 {
69         char        *buf;
70         int          rc, size;
71
72         rc = -sa_size(hdl, SA_ZPL_DXATTR(osd), &size);
73         if (rc) {
74                 if (rc == -ENOENT)
75                         rc = -nvlist_alloc(sa, NV_UNIQUE_NAME, KM_SLEEP);
76                 goto out_sa;
77         }
78
79         buf = osd_zio_buf_alloc(size);
80         if (buf == NULL) {
81                 rc = -ENOMEM;
82                 goto out_sa;
83         }
84         rc = -sa_lookup(hdl, SA_ZPL_DXATTR(osd), buf, size);
85         if (rc == 0)
86                 rc = -nvlist_unpack(buf, size, sa, KM_SLEEP);
87         osd_zio_buf_free(buf, size);
88 out_sa:
89
90         return rc;
91 }
92
93 static inline int __osd_xattr_cache(struct osd_object *obj)
94 {
95         LASSERT(obj->oo_sa_hdl);
96         if (obj->oo_sa_xattr != NULL)
97                 return 0;
98         return __osd_xattr_load(osd_obj2dev(obj),
99                                 obj->oo_sa_hdl, &obj->oo_sa_xattr);
100 }
101
102 static int
103 __osd_sa_xattr_get(const struct lu_env *env, struct osd_object *obj,
104                    const struct lu_buf *buf, const char *name, int *sizep)
105 {
106         uchar_t *nv_value;
107         int      rc = 0;
108
109         rc = __osd_xattr_cache(obj);
110         if (rc)
111                 return rc;
112
113         LASSERT(obj->oo_sa_xattr);
114         rc = -nvlist_lookup_byte_array(obj->oo_sa_xattr, name,
115                                        &nv_value, sizep);
116         if (rc)
117                 return rc;
118
119         if (buf == NULL || buf->lb_buf == NULL) {
120                 /* return the required size by *sizep */
121                 return 0;
122         }
123
124         if (*sizep > buf->lb_len)
125                 return -ERANGE; /* match ldiskfs error */
126
127         memcpy(buf->lb_buf, nv_value, *sizep);
128         return 0;
129 }
130
131 int __osd_xattr_get_large(const struct lu_env *env, struct osd_device *osd,
132                           uint64_t xattr, struct lu_buf *buf,
133                           const char *name, int *sizep)
134 {
135         dnode_t         *xa_data_dn;
136         sa_handle_t *sa_hdl = NULL;
137         uint64_t         xa_data_obj, size;
138         int              rc;
139
140         /* are there any extended attributes? */
141         if (xattr == ZFS_NO_OBJECT)
142                 return -ENOENT;
143
144         /* Lookup the object number containing the xattr data */
145         rc = -zap_lookup(osd->od_os, xattr, name, sizeof(uint64_t), 1,
146                         &xa_data_obj);
147         if (rc)
148                 return rc;
149
150         rc = __osd_obj2dnode(osd->od_os, xa_data_obj, &xa_data_dn);
151         if (rc)
152                 return rc;
153
154         rc = -sa_handle_get(osd->od_os, xa_data_obj, NULL, SA_HDL_PRIVATE,
155                         &sa_hdl);
156         if (rc)
157                 goto out_rele;
158
159         /* Get the xattr value length / object size */
160         rc = -sa_lookup(sa_hdl, SA_ZPL_SIZE(osd), &size, 8);
161         if (rc)
162                 goto out;
163
164         if (size > INT_MAX) {
165                 rc = -EOVERFLOW;
166                 goto out;
167         }
168
169         *sizep = (int)size;
170
171         if (buf == NULL || buf->lb_buf == NULL) {
172                 /* We only need to return the required size */
173                 goto out;
174         }
175         if (*sizep > buf->lb_len) {
176                 rc = -ERANGE; /* match ldiskfs error */
177                 goto out;
178         }
179
180         rc = -dmu_read(osd->od_os, xa_data_dn->dn_object, 0,
181                         size, buf->lb_buf, DMU_READ_PREFETCH);
182
183 out:
184         sa_handle_destroy(sa_hdl);
185 out_rele:
186         osd_dnode_rele(xa_data_dn);
187
188         return rc;
189 }
190
191 /**
192  * Copy an extended attribute into the buffer provided, or compute
193  * the required buffer size if \a buf is NULL.
194  *
195  * On success, the number of bytes used or required is stored in \a sizep.
196  *
197  * Note that no locking is done here.
198  *
199  * \param[in] env      execution environment
200  * \param[in] obj      object for which to retrieve xattr
201  * \param[out] buf     buffer to store xattr value in
202  * \param[in] name     name of xattr to copy
203  * \param[out] sizep   bytes used or required to store xattr
204  *
205  * \retval 0           on success
206  * \retval negative    negated errno on failure
207  */
208 int __osd_xattr_get(const struct lu_env *env, struct osd_object *obj,
209                     struct lu_buf *buf, const char *name, int *sizep)
210 {
211         int rc;
212
213         if (unlikely(!dt_object_exists(&obj->oo_dt) || obj->oo_destroyed))
214                 return -ENOENT;
215
216         /* check SA_ZPL_DXATTR first then fallback to directory xattr */
217         rc = __osd_sa_xattr_get(env, obj, buf, name, sizep);
218         if (rc != -ENOENT)
219                 return rc;
220
221         return __osd_xattr_get_large(env, osd_obj2dev(obj), obj->oo_xattr,
222                                      buf, name, sizep);
223 }
224
225 int osd_xattr_get(const struct lu_env *env, struct dt_object *dt,
226                   struct lu_buf *buf, const char *name)
227 {
228         struct osd_object  *obj  = osd_dt_obj(dt);
229         int                 rc, size = 0;
230         ENTRY;
231
232         LASSERT(obj->oo_dn != NULL);
233         LASSERT(osd_invariant(obj));
234
235         if (!osd_obj2dev(obj)->od_posix_acl &&
236             (strcmp(name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
237              strcmp(name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0))
238                 RETURN(-EOPNOTSUPP);
239
240         down_read(&obj->oo_guard);
241         rc = __osd_xattr_get(env, obj, buf, name, &size);
242         up_read(&obj->oo_guard);
243
244         if (rc == -ENOENT)
245                 rc = -ENODATA;
246         else if (rc == 0)
247                 rc = size;
248         RETURN(rc);
249 }
250
251 /* the function is used to declare EAs when SA is not supported */
252 void __osd_xattr_declare_legacy(const struct lu_env *env,
253                                 struct osd_object *obj,
254                                 int vallen, const char *name,
255                                 struct osd_thandle *oh)
256 {
257         struct osd_device *osd = osd_obj2dev(obj);
258         dmu_tx_t *tx = oh->ot_tx;
259         uint64_t xa_data_obj;
260         int rc;
261
262         if (obj->oo_xattr == ZFS_NO_OBJECT) {
263                 /* xattr zap + entry */
264                 dmu_tx_hold_zap(tx, DMU_NEW_OBJECT, TRUE, (char *) name);
265                 /* xattr value obj */
266                 dmu_tx_hold_sa_create(tx, ZFS_SA_BASE_ATTR_SIZE);
267                 dmu_tx_hold_write(tx, DMU_NEW_OBJECT, 0, vallen);
268                 return;
269         }
270
271         rc = -zap_lookup(osd->od_os, obj->oo_xattr, name, sizeof(uint64_t), 1,
272                         &xa_data_obj);
273         if (rc == 0) {
274                 /*
275                  * Entry already exists.
276                  * We'll truncate the existing object.
277                  */
278                 dmu_tx_hold_bonus(tx, xa_data_obj);
279                 dmu_tx_hold_free(tx, xa_data_obj, vallen, DMU_OBJECT_END);
280                 dmu_tx_hold_write(tx, xa_data_obj, 0, vallen);
281         } else if (rc == -ENOENT) {
282                 /*
283                  * Entry doesn't exist, we need to create a new one and a new
284                  * object to store the value.
285                  */
286                 dmu_tx_hold_bonus(tx, obj->oo_xattr);
287                 dmu_tx_hold_zap(tx, obj->oo_xattr, TRUE, (char *) name);
288                 dmu_tx_hold_sa_create(tx, ZFS_SA_BASE_ATTR_SIZE);
289                 dmu_tx_hold_write(tx, DMU_NEW_OBJECT, 0, vallen);
290         }
291 }
292
293 void __osd_xattr_declare_set(const struct lu_env *env, struct osd_object *obj,
294                              int vallen, const char *name,
295                              struct osd_thandle *oh)
296 {
297         dmu_tx_t *tx = oh->ot_tx;
298         int bonuslen;
299
300         if (unlikely(obj->oo_destroyed))
301                 return;
302
303         if (unlikely(!osd_obj2dev(obj)->od_xattr_in_sa)) {
304                 __osd_xattr_declare_legacy(env, obj, vallen, name, oh);
305                 return;
306         }
307
308         /* declare EA in SA */
309         if (dt_object_exists(&obj->oo_dt)) {
310                 LASSERT(obj->oo_sa_hdl);
311                 /* XXX: it should be possible to skip spill
312                  * declaration if specific EA is part of
313                  * bonus and doesn't grow */
314                 dmu_tx_hold_spill(tx, obj->oo_dn->dn_object);
315                 return;
316         }
317
318         bonuslen = osd_obj_bonuslen(obj);
319
320         /* the object doesn't exist, but we've declared bonus
321          * in osd_declare_object_create() yet */
322         if (obj->oo_ea_in_bonus > bonuslen) {
323                 /* spill has been declared already */
324         } else if (obj->oo_ea_in_bonus + vallen > bonuslen) {
325                 /* we're about to exceed bonus, let's declare spill */
326                 dmu_tx_hold_spill(tx, DMU_NEW_OBJECT);
327         }
328         obj->oo_ea_in_bonus += vallen;
329 }
330
331 int osd_declare_xattr_set(const struct lu_env *env, struct dt_object *dt,
332                           const struct lu_buf *buf, const char *name,
333                           int fl, struct thandle *handle)
334 {
335         struct osd_object  *obj = osd_dt_obj(dt);
336         struct osd_thandle *oh;
337         ENTRY;
338
339         LASSERT(handle != NULL);
340         oh = container_of0(handle, struct osd_thandle, ot_super);
341
342         down_read(&obj->oo_guard);
343         __osd_xattr_declare_set(env, obj, buf->lb_len, name, oh);
344         up_read(&obj->oo_guard);
345
346         RETURN(0);
347 }
348
349 int __osd_sa_attr_init(const struct lu_env *env, struct osd_object *obj,
350                        struct osd_thandle *oh)
351 {
352         sa_bulk_attr_t  *bulk = osd_oti_get(env)->oti_attr_bulk;
353         struct osa_attr *osa = &osd_oti_get(env)->oti_osa;
354         struct lu_buf *lb = &osd_oti_get(env)->oti_xattr_lbuf;
355         struct osd_device *osd = osd_obj2dev(obj);
356         uint64_t crtime[2], gen;
357         timestruc_t now;
358         size_t size;
359         int rc, cnt;
360
361         obj->oo_late_xattr = 0;
362         obj->oo_late_attr_set = 0;
363
364         gen = dmu_tx_get_txg(oh->ot_tx);
365         gethrestime(&now);
366         ZFS_TIME_ENCODE(&now, crtime);
367
368         osa->atime[0] = obj->oo_attr.la_atime;
369         osa->ctime[0] = obj->oo_attr.la_ctime;
370         osa->mtime[0] = obj->oo_attr.la_mtime;
371         osa->mode = obj->oo_attr.la_mode;
372         osa->uid = obj->oo_attr.la_uid;
373         osa->gid = obj->oo_attr.la_gid;
374         osa->rdev = obj->oo_attr.la_rdev;
375         osa->nlink = obj->oo_attr.la_nlink;
376         osa->flags = attrs_fs2zfs(obj->oo_attr.la_flags);
377         osa->size  = obj->oo_attr.la_size;
378 #ifdef ZFS_PROJINHERIT
379         if (osd->od_projectused_dn) {
380                 if (obj->oo_attr.la_valid & LA_PROJID)
381                         osa->projid = obj->oo_attr.la_projid;
382                 else
383                         osa->projid = ZFS_DEFAULT_PROJID;
384                 osa->flags |= ZFS_PROJID;
385                 obj->oo_with_projid = 1;
386         }
387 #endif
388
389         cnt = 0;
390         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_MODE(osd), NULL, &osa->mode, 8);
391         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_SIZE(osd), NULL, &osa->size, 8);
392         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_GEN(osd), NULL, &gen, 8);
393         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_UID(osd), NULL, &osa->uid, 8);
394         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_GID(osd), NULL, &osa->gid, 8);
395         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_PARENT(osd), NULL,
396                          &obj->oo_parent, 8);
397         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_FLAGS(osd), NULL, &osa->flags, 8);
398         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_ATIME(osd), NULL, osa->atime, 16);
399         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_MTIME(osd), NULL, osa->mtime, 16);
400         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_CTIME(osd), NULL, osa->ctime, 16);
401         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_CRTIME(osd), NULL, crtime, 16);
402         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_LINKS(osd), NULL, &osa->nlink, 8);
403 #ifdef ZFS_PROJINHERIT
404         if (osd->od_projectused_dn)
405                 SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_PROJID(osd), NULL,
406                                  &osa->projid, 8);
407 #endif
408         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_RDEV(osd), NULL, &osa->rdev, 8);
409         LASSERT(cnt <= ARRAY_SIZE(osd_oti_get(env)->oti_attr_bulk));
410
411         /* Update the SA for additions, modifications, and removals. */
412         rc = -nvlist_size(obj->oo_sa_xattr, &size, NV_ENCODE_XDR);
413         if (rc)
414                 return rc;
415
416         lu_buf_check_and_alloc(lb, size);
417         if (lb->lb_buf == NULL) {
418                 CERROR("%s: can't allocate buffer for xattr update\n",
419                                 osd->od_svname);
420                 return -ENOMEM;
421         }
422
423         rc = -nvlist_pack(obj->oo_sa_xattr, (char **)&lb->lb_buf, &size,
424                           NV_ENCODE_XDR, KM_SLEEP);
425         if (rc)
426                 return rc;
427
428         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_DXATTR(osd), NULL, lb->lb_buf, size);
429
430         rc = -sa_replace_all_by_template(obj->oo_sa_hdl, bulk, cnt, oh->ot_tx);
431
432         return rc;
433 }
434
435 int __osd_sa_xattr_update(const struct lu_env *env, struct osd_object *obj,
436                            struct osd_thandle *oh)
437 {
438         struct lu_buf     *lb = &osd_oti_get(env)->oti_xattr_lbuf;
439         struct osd_device *osd = osd_obj2dev(obj);
440         char              *dxattr;
441         size_t             size;
442         int                rc;
443
444         obj->oo_late_xattr = 0;
445
446         /* Update the SA for additions, modifications, and removals. */
447         rc = -nvlist_size(obj->oo_sa_xattr, &size, NV_ENCODE_XDR);
448         if (rc)
449                 return rc;
450
451         lu_buf_check_and_alloc(lb, size);
452         if (lb->lb_buf == NULL) {
453                 CERROR("%s: can't allocate buffer for xattr update\n",
454                                 osd->od_svname);
455                 return -ENOMEM;
456         }
457
458         dxattr = lb->lb_buf;
459         rc = -nvlist_pack(obj->oo_sa_xattr, &dxattr, &size,
460                         NV_ENCODE_XDR, KM_SLEEP);
461         if (rc)
462                 return rc;
463         LASSERT(dxattr == lb->lb_buf);
464
465         sa_update(obj->oo_sa_hdl, SA_ZPL_DXATTR(osd), dxattr, size, oh->ot_tx);
466
467         return 0;
468 }
469
470 /*
471  * Set an extended attribute.
472  * This transaction must have called udmu_xattr_declare_set() first.
473  *
474  * Returns 0 on success or a negative error number on failure.
475  *
476  * No locking is done here.
477  */
478 int __osd_sa_xattr_schedule_update(const struct lu_env *env,
479                                    struct osd_object *obj,
480                                    struct osd_thandle *oh)
481 {
482         ENTRY;
483         LASSERT(obj->oo_sa_hdl);
484         LASSERT(obj->oo_sa_xattr);
485
486         /* schedule batched SA update in osd_object_sa_dirty_rele() */
487         obj->oo_late_xattr = 1;
488         osd_object_sa_dirty_add(obj, oh);
489
490         RETURN(0);
491
492 }
493
494 int __osd_sa_xattr_set(const struct lu_env *env, struct osd_object *obj,
495                        const struct lu_buf *buf, const char *name, int fl,
496                        struct osd_thandle *oh)
497 {
498         uchar_t *nv_value;
499         size_t  size;
500         int     nv_size;
501         int     rc;
502         int     too_big = 0;
503
504         rc = __osd_xattr_cache(obj);
505         if (rc)
506                 return rc;
507
508         LASSERT(obj->oo_sa_xattr);
509         /* Limited to 32k to keep nvpair memory allocations small */
510         if (buf->lb_len > DXATTR_MAX_ENTRY_SIZE) {
511                 too_big = 1;
512         } else {
513                 /* Prevent the DXATTR SA from consuming the entire SA
514                  * region */
515                 rc = -nvlist_size(obj->oo_sa_xattr, &size, NV_ENCODE_XDR);
516                 if (rc)
517                         return rc;
518
519                 if (size + buf->lb_len > DXATTR_MAX_SA_SIZE)
520                         too_big = 1;
521         }
522
523         /* even in case of -EFBIG we must lookup xattr and check can we
524          * rewrite it then delete from SA */
525         rc = -nvlist_lookup_byte_array(obj->oo_sa_xattr, name, &nv_value,
526                                         &nv_size);
527         if (rc == 0) {
528                 if (fl & LU_XATTR_CREATE) {
529                         return -EEXIST;
530                 } else if (too_big) {
531                         rc = -nvlist_remove(obj->oo_sa_xattr, name,
532                                                 DATA_TYPE_BYTE_ARRAY);
533                         if (rc < 0)
534                                 return rc;
535                         rc = __osd_sa_xattr_schedule_update(env, obj, oh);
536                         return rc == 0 ? -EFBIG : rc;
537                 }
538         } else if (rc == -ENOENT) {
539                 if (fl & LU_XATTR_REPLACE)
540                         return -ENODATA;
541                 else if (too_big)
542                         return -EFBIG;
543         } else {
544                 return rc;
545         }
546
547         /* Ensure xattr doesn't exist in ZAP */
548         if (obj->oo_xattr != ZFS_NO_OBJECT) {
549                 struct osd_device *osd = osd_obj2dev(obj);
550                 uint64_t           objid;
551                 rc = -zap_lookup(osd->od_os, obj->oo_xattr,
552                                  name, 8, 1, &objid);
553                 if (rc == 0) {
554                         rc = -dmu_object_free(osd->od_os, objid, oh->ot_tx);
555                         if (rc == 0)
556                                 zap_remove(osd->od_os, obj->oo_xattr,
557                                            name, oh->ot_tx);
558                 }
559         }
560
561         rc = -nvlist_add_byte_array(obj->oo_sa_xattr, name,
562                                     (uchar_t *)buf->lb_buf, buf->lb_len);
563         if (rc)
564                 return rc;
565
566         /* batch updates only for just created dnodes where we
567          * used to set number of EAs in a single transaction */
568         if (obj->oo_dn->dn_allocated_txg == oh->ot_tx->tx_txg)
569                 rc = __osd_sa_xattr_schedule_update(env, obj, oh);
570         else
571                 rc = __osd_sa_xattr_update(env, obj, oh);
572
573         return rc;
574 }
575
576 int
577 __osd_xattr_set(const struct lu_env *env, struct osd_object *obj,
578                 const struct lu_buf *buf, const char *name, int fl,
579                 struct osd_thandle *oh)
580 {
581         struct osd_device *osd = osd_obj2dev(obj);
582         dnode_t *xa_zap_dn = NULL;
583         dnode_t *xa_data_dn = NULL;
584         uint64_t           xa_data_obj;
585         sa_handle_t       *sa_hdl = NULL;
586         dmu_tx_t          *tx = oh->ot_tx;
587         uint64_t           size;
588         int                rc;
589
590         LASSERT(obj->oo_sa_hdl);
591
592         if (obj->oo_xattr == ZFS_NO_OBJECT) {
593                 struct lu_attr *la = &osd_oti_get(env)->oti_la;
594
595                 la->la_valid = LA_MODE;
596                 la->la_mode = S_IFDIR | S_IRUGO | S_IWUSR | S_IXUGO;
597                 rc = __osd_zap_create(env, osd, &xa_zap_dn, tx, la, 0, 0);
598                 if (rc)
599                         return rc;
600
601                 obj->oo_xattr = xa_zap_dn->dn_object;
602                 rc = osd_object_sa_update(obj, SA_ZPL_XATTR(osd),
603                                 &obj->oo_xattr, 8, oh);
604                 if (rc)
605                         goto out;
606         }
607
608         rc = -zap_lookup(osd->od_os, obj->oo_xattr, name, sizeof(uint64_t), 1,
609                          &xa_data_obj);
610         if (rc == 0) {
611                 if (fl & LU_XATTR_CREATE) {
612                         rc = -EEXIST;
613                         goto out;
614                 }
615                 /*
616                  * Entry already exists.
617                  * We'll truncate the existing object.
618                  */
619                 rc = __osd_obj2dnode(osd->od_os, xa_data_obj, &xa_data_dn);
620                 if (rc)
621                         goto out;
622
623                 rc = -sa_handle_get(osd->od_os, xa_data_obj, NULL,
624                                         SA_HDL_PRIVATE, &sa_hdl);
625                 if (rc)
626                         goto out;
627
628                 rc = -sa_lookup(sa_hdl, SA_ZPL_SIZE(osd), &size, 8);
629                 if (rc)
630                         goto out_sa;
631
632                 rc = -dmu_free_range(osd->od_os, xa_data_dn->dn_object,
633                                      0, DMU_OBJECT_END, tx);
634                 if (rc)
635                         goto out_sa;
636         } else if (rc == -ENOENT) {
637                 struct lu_attr *la = &osd_oti_get(env)->oti_la;
638                 /*
639                  * Entry doesn't exist, we need to create a new one and a new
640                  * object to store the value.
641                  */
642                 if (fl & LU_XATTR_REPLACE) {
643                         /* should be ENOATTR according to the
644                          * man, but that is undefined here */
645                         rc = -ENODATA;
646                         goto out;
647                 }
648
649                 la->la_valid = LA_MODE;
650                 la->la_mode = S_IFREG | S_IRUGO | S_IWUSR;
651                 rc = __osd_object_create(env, obj, &xa_data_dn, tx, la);
652                 if (rc)
653                         goto out;
654                 xa_data_obj = xa_data_dn->dn_object;
655
656                 rc = -sa_handle_get(osd->od_os, xa_data_obj, NULL,
657                                         SA_HDL_PRIVATE, &sa_hdl);
658                 if (rc)
659                         goto out;
660
661                 rc = -zap_add(osd->od_os, obj->oo_xattr, name, sizeof(uint64_t),
662                                 1, &xa_data_obj, tx);
663                 if (rc)
664                         goto out_sa;
665         } else {
666                 /* There was an error looking up the xattr name */
667                 goto out;
668         }
669
670         /* Finally write the xattr value */
671         dmu_write(osd->od_os, xa_data_obj, 0, buf->lb_len, buf->lb_buf, tx);
672
673         size = buf->lb_len;
674         rc = -sa_update(sa_hdl, SA_ZPL_SIZE(osd), &size, 8, tx);
675
676 out_sa:
677         sa_handle_destroy(sa_hdl);
678 out:
679         if (xa_data_dn != NULL)
680                 osd_dnode_rele(xa_data_dn);
681         if (xa_zap_dn != NULL)
682                 osd_dnode_rele(xa_zap_dn);
683
684         return rc;
685 }
686
687 int osd_xattr_set(const struct lu_env *env, struct dt_object *dt,
688                   const struct lu_buf *buf, const char *name, int fl,
689                   struct thandle *handle)
690 {
691         struct osd_object  *obj = osd_dt_obj(dt);
692         struct osd_thandle *oh;
693         int rc = 0;
694         ENTRY;
695
696         LASSERT(handle != NULL);
697         LASSERT(osd_invariant(obj));
698
699         if (!osd_obj2dev(obj)->od_posix_acl &&
700             (strcmp(name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
701              strcmp(name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0))
702                 RETURN(-EOPNOTSUPP);
703
704         oh = container_of0(handle, struct osd_thandle, ot_super);
705
706         down_write(&obj->oo_guard);
707         CDEBUG(D_INODE, "Setting xattr %s with size %d\n",
708                 name, (int)buf->lb_len);
709         rc = osd_xattr_set_internal(env, obj, buf, name, fl, oh);
710         up_write(&obj->oo_guard);
711
712         RETURN(rc);
713 }
714
715 static void
716 __osd_xattr_declare_del(const struct lu_env *env, struct osd_object *obj,
717                         const char *name, struct osd_thandle *oh)
718 {
719         struct osd_device *osd = osd_obj2dev(obj);
720         dmu_tx_t          *tx = oh->ot_tx;
721         uint64_t           xa_data_obj;
722         int                rc;
723
724         /* update SA_ZPL_DXATTR if xattr was in SA */
725         dmu_tx_hold_sa(tx, obj->oo_sa_hdl, 0);
726
727         if (obj->oo_xattr == ZFS_NO_OBJECT)
728                 return;
729
730         rc = -zap_lookup(osd->od_os, obj->oo_xattr, name, 8, 1, &xa_data_obj);
731         if (rc == 0) {
732                 /*
733                  * Entry exists.
734                  * We'll delete the existing object and ZAP entry.
735                  */
736                 dmu_tx_hold_bonus(tx, xa_data_obj);
737                 dmu_tx_hold_free(tx, xa_data_obj, 0, DMU_OBJECT_END);
738                 dmu_tx_hold_zap(tx, obj->oo_xattr, FALSE, (char *) name);
739                 return;
740         } else if (rc == -ENOENT) {
741                 /*
742                  * Entry doesn't exist, nothing to be changed.
743                  */
744                 return;
745         }
746
747         /* An error happened */
748         tx->tx_err = -rc;
749 }
750
751 int osd_declare_xattr_del(const struct lu_env *env, struct dt_object *dt,
752                           const char *name, struct thandle *handle)
753 {
754         struct osd_object  *obj = osd_dt_obj(dt);
755         struct osd_thandle *oh;
756         ENTRY;
757
758         LASSERT(handle != NULL);
759         LASSERT(osd_invariant(obj));
760
761         oh = container_of0(handle, struct osd_thandle, ot_super);
762         LASSERT(oh->ot_tx != NULL);
763         LASSERT(obj->oo_dn != NULL);
764
765         down_read(&obj->oo_guard);
766         if (likely(dt_object_exists(&obj->oo_dt) && !obj->oo_destroyed))
767                 __osd_xattr_declare_del(env, obj, name, oh);
768         up_read(&obj->oo_guard);
769
770         RETURN(0);
771 }
772
773 static int __osd_sa_xattr_del(const struct lu_env *env, struct osd_object *obj,
774                               const char *name, struct osd_thandle *oh)
775 {
776         int rc;
777
778         rc = __osd_xattr_cache(obj);
779         if (rc)
780                 return rc;
781
782         rc = -nvlist_remove(obj->oo_sa_xattr, name, DATA_TYPE_BYTE_ARRAY);
783         if (rc == 0)
784                 rc = __osd_sa_xattr_schedule_update(env, obj, oh);
785         return rc;
786 }
787
788 static int __osd_xattr_del(const struct lu_env *env, struct osd_object *obj,
789                            const char *name, struct osd_thandle *oh)
790 {
791         struct osd_device *osd = osd_obj2dev(obj);
792         uint64_t           xa_data_obj;
793         int                rc;
794
795         if (unlikely(!dt_object_exists(&obj->oo_dt) || obj->oo_destroyed))
796                 return -ENOENT;
797
798         /* try remove xattr from SA at first */
799         rc = __osd_sa_xattr_del(env, obj, name, oh);
800         if (rc != -ENOENT)
801                 return rc;
802
803         if (obj->oo_xattr == ZFS_NO_OBJECT)
804                 return 0;
805
806         rc = -zap_lookup(osd->od_os, obj->oo_xattr, name, sizeof(uint64_t), 1,
807                         &xa_data_obj);
808         if (rc == -ENOENT) {
809                 rc = 0;
810         } else if (rc == 0) {
811                 /*
812                  * Entry exists.
813                  * We'll delete the existing object and ZAP entry.
814                  */
815                 rc = -dmu_object_free(osd->od_os, xa_data_obj, oh->ot_tx);
816                 if (rc)
817                         return rc;
818
819                 rc = -zap_remove(osd->od_os, obj->oo_xattr, name, oh->ot_tx);
820         }
821
822         return rc;
823 }
824
825 int osd_xattr_del(const struct lu_env *env, struct dt_object *dt,
826                   const char *name, struct thandle *handle)
827 {
828         struct osd_object  *obj = osd_dt_obj(dt);
829         struct osd_thandle *oh;
830         int                 rc;
831         ENTRY;
832
833         LASSERT(handle != NULL);
834         LASSERT(obj->oo_dn != NULL);
835         LASSERT(osd_invariant(obj));
836         LASSERT(dt_object_exists(dt));
837         oh = container_of0(handle, struct osd_thandle, ot_super);
838         LASSERT(oh->ot_tx != NULL);
839
840         if (!osd_obj2dev(obj)->od_posix_acl &&
841             (strcmp(name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
842              strcmp(name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0))
843                 RETURN(-EOPNOTSUPP);
844
845         down_write(&obj->oo_guard);
846         rc = __osd_xattr_del(env, obj, name, oh);
847         up_write(&obj->oo_guard);
848
849         RETURN(rc);
850 }
851
852 void osd_declare_xattrs_destroy(const struct lu_env *env,
853                                 struct osd_object *obj, struct osd_thandle *oh)
854 {
855         struct osd_device *osd = osd_obj2dev(obj);
856         zap_attribute_t   *za = &osd_oti_get(env)->oti_za;
857         uint64_t           oid = obj->oo_xattr, xid;
858         dmu_tx_t          *tx = oh->ot_tx;
859         zap_cursor_t      *zc;
860         int                rc;
861
862         if (oid == ZFS_NO_OBJECT)
863                 return; /* Nothing to do for SA xattrs */
864
865         /* Declare to free the ZAP holding xattrs */
866         dmu_tx_hold_free(tx, oid, 0, DMU_OBJECT_END);
867
868         rc = osd_zap_cursor_init(&zc, osd->od_os, oid, 0);
869         if (rc)
870                 goto out;
871
872         while (zap_cursor_retrieve(zc, za) == 0) {
873                 LASSERT(za->za_num_integers == 1);
874                 LASSERT(za->za_integer_length == sizeof(uint64_t));
875
876                 rc = -zap_lookup(osd->od_os, oid, za->za_name,
877                                  sizeof(uint64_t), 1, &xid);
878                 if (rc) {
879                         CERROR("%s: xattr %s lookup failed: rc = %d\n",
880                                osd->od_svname, za->za_name, rc);
881                         break;
882                 }
883                 dmu_tx_hold_free(tx, xid, 0, DMU_OBJECT_END);
884
885                 zap_cursor_advance(zc);
886         }
887
888         osd_zap_cursor_fini(zc);
889 out:
890         if (rc && tx->tx_err == 0)
891                 tx->tx_err = -rc;
892 }
893
894 int osd_xattrs_destroy(const struct lu_env *env,
895                        struct osd_object *obj, struct osd_thandle *oh)
896 {
897         struct osd_device *osd = osd_obj2dev(obj);
898         dmu_tx_t          *tx = oh->ot_tx;
899         zap_attribute_t   *za = &osd_oti_get(env)->oti_za;
900         zap_cursor_t      *zc;
901         uint64_t           xid;
902         int                rc;
903
904         /* The transaction must have been assigned to a transaction group. */
905         LASSERT(tx->tx_txg != 0);
906
907         if (obj->oo_xattr == ZFS_NO_OBJECT)
908                 return 0; /* Nothing to do for SA xattrs */
909
910         /* Free the ZAP holding the xattrs */
911         rc = osd_zap_cursor_init(&zc, osd->od_os, obj->oo_xattr, 0);
912         if (rc)
913                 return rc;
914
915         while (zap_cursor_retrieve(zc, za) == 0) {
916                 LASSERT(za->za_num_integers == 1);
917                 LASSERT(za->za_integer_length == sizeof(uint64_t));
918
919                 rc = -zap_lookup(osd->od_os, obj->oo_xattr, za->za_name,
920                                  sizeof(uint64_t), 1, &xid);
921                 if (rc) {
922                         CERROR("%s: lookup xattr %s failed: rc = %d\n",
923                                osd->od_svname, za->za_name, rc);
924                 } else {
925                         rc = -dmu_object_free(osd->od_os, xid, tx);
926                         if (rc)
927                                 CERROR("%s: free xattr %s failed: rc = %d\n",
928                                        osd->od_svname, za->za_name, rc);
929                 }
930                 zap_cursor_advance(zc);
931         }
932         osd_zap_cursor_fini(zc);
933
934         rc = -dmu_object_free(osd->od_os, obj->oo_xattr, tx);
935         if (rc)
936                 CERROR("%s: free xattr %llu failed: rc = %d\n",
937                        osd->od_svname, obj->oo_xattr, rc);
938
939         return rc;
940 }
941
942 static int
943 osd_sa_xattr_list(const struct lu_env *env, struct osd_object *obj,
944                   const struct lu_buf *lb)
945 {
946         nvpair_t *nvp = NULL;
947         int       len, counted = 0;
948         int       rc = 0;
949
950         rc = __osd_xattr_cache(obj);
951         if (rc)
952                 return rc;
953
954         while ((nvp = nvlist_next_nvpair(obj->oo_sa_xattr, nvp)) != NULL) {
955                 const char *name = nvpair_name(nvp);
956
957                 if (!osd_obj2dev(obj)->od_posix_acl &&
958                     (strcmp(name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
959                      strcmp(name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0))
960                         continue;
961
962                 len = strlen(name);
963                 if (lb->lb_buf != NULL) {
964                         if (counted + len + 1 > lb->lb_len)
965                                 return -ERANGE;
966
967                         memcpy(lb->lb_buf + counted, name, len + 1);
968                 }
969                 counted += len + 1;
970         }
971         return counted;
972 }
973
974 int osd_xattr_list(const struct lu_env *env, struct dt_object *dt,
975                    const struct lu_buf *lb)
976 {
977         struct osd_object      *obj = osd_dt_obj(dt);
978         struct osd_device      *osd = osd_obj2dev(obj);
979         zap_attribute_t        *za = &osd_oti_get(env)->oti_za;
980         zap_cursor_t           *zc;
981         int                    rc, counted;
982         ENTRY;
983
984         LASSERT(obj->oo_dn != NULL);
985         LASSERT(osd_invariant(obj));
986         LASSERT(dt_object_exists(dt));
987
988         down_read(&obj->oo_guard);
989
990         rc = osd_sa_xattr_list(env, obj, lb);
991         if (rc < 0)
992                 GOTO(out, rc);
993
994         counted = rc;
995
996         /* continue with dnode xattr if any */
997         if (obj->oo_xattr == ZFS_NO_OBJECT)
998                 GOTO(out, rc = counted);
999
1000         rc = osd_zap_cursor_init(&zc, osd->od_os, obj->oo_xattr, 0);
1001         if (rc)
1002                 GOTO(out, rc);
1003
1004         while ((rc = -zap_cursor_retrieve(zc, za)) == 0) {
1005                 if (!osd_obj2dev(obj)->od_posix_acl &&
1006                     (strcmp(za->za_name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
1007                      strcmp(za->za_name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0)) {
1008                         zap_cursor_advance(zc);
1009                         continue;
1010                 }
1011
1012                 rc = strlen(za->za_name);
1013                 if (lb->lb_buf != NULL) {
1014                         if (counted + rc + 1 > lb->lb_len)
1015                                 GOTO(out_fini, rc = -ERANGE);
1016
1017                         memcpy(lb->lb_buf + counted, za->za_name, rc + 1);
1018                 }
1019                 counted += rc + 1;
1020
1021                 zap_cursor_advance(zc);
1022         }
1023         if (rc == -ENOENT) /* no more kes in the index */
1024                 rc = 0;
1025         else if (unlikely(rc < 0))
1026                 GOTO(out_fini, rc);
1027         rc = counted;
1028
1029 out_fini:
1030         osd_zap_cursor_fini(zc);
1031 out:
1032         up_read(&obj->oo_guard);
1033         RETURN(rc);
1034
1035 }