Whamcloud - gitweb
35c36c9919d14be10bd95f8e5cab44eb5abe4636
[fs/lustre-release.git] / lustre / osd-zfs / osd_xattr.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2009, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2012, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/osd-zfs/osd_xattr.c
33  * functions to manipulate extended attributes and system attributes
34  *
35  * Author: Alex Zhuravlev <bzzz@whamcloud.com>
36  * Author: Mike Pershin <tappro@whamcloud.com>
37  */
38
39 #define DEBUG_SUBSYSTEM S_OSD
40
41 #include <libcfs/libcfs.h>
42 #include <obd_support.h>
43 #include <lustre_net.h>
44 #include <obd.h>
45 #include <obd_class.h>
46 #include <lustre_disk.h>
47 #include <lustre_fid.h>
48 #include <lustre_linkea.h>
49
50 #include "osd_internal.h"
51
52 #include <sys/dnode.h>
53 #include <sys/dbuf.h>
54 #include <sys/spa.h>
55 #include <sys/stat.h>
56 #include <sys/zap.h>
57 #include <sys/spa_impl.h>
58 #include <sys/zfs_znode.h>
59 #include <sys/dmu_tx.h>
60 #include <sys/dmu_objset.h>
61 #include <sys/dsl_prop.h>
62 #include <sys/sa_impl.h>
63 #include <sys/txg.h>
64
65 #include <linux/posix_acl_xattr.h>
66 #include <lustre_scrub.h>
67
68 int __osd_xattr_load(struct osd_device *osd, sa_handle_t *hdl, nvlist_t **sa)
69 {
70         char        *buf;
71         int          rc, size;
72
73         rc = -sa_size(hdl, SA_ZPL_DXATTR(osd), &size);
74         if (rc) {
75                 if (rc == -ENOENT)
76                         rc = -nvlist_alloc(sa, NV_UNIQUE_NAME, KM_SLEEP);
77                 goto out_sa;
78         }
79
80         buf = osd_zio_buf_alloc(size);
81         if (buf == NULL) {
82                 rc = -ENOMEM;
83                 goto out_sa;
84         }
85         rc = -sa_lookup(hdl, SA_ZPL_DXATTR(osd), buf, size);
86         if (rc == 0)
87                 rc = -nvlist_unpack(buf, size, sa, KM_SLEEP);
88         osd_zio_buf_free(buf, size);
89 out_sa:
90
91         return rc;
92 }
93
94 static inline int __osd_xattr_cache(struct osd_object *obj)
95 {
96         LASSERT(obj->oo_sa_hdl);
97         if (obj->oo_sa_xattr != NULL)
98                 return 0;
99         return __osd_xattr_load(osd_obj2dev(obj),
100                                 obj->oo_sa_hdl, &obj->oo_sa_xattr);
101 }
102
103 static int
104 __osd_sa_xattr_get(const struct lu_env *env, struct osd_object *obj,
105                    const struct lu_buf *buf, const char *name, int *sizep)
106 {
107         uchar_t *nv_value;
108         int      rc = 0;
109
110         rc = __osd_xattr_cache(obj);
111         if (rc)
112                 return rc;
113
114         LASSERT(obj->oo_sa_xattr);
115         rc = -nvlist_lookup_byte_array(obj->oo_sa_xattr, name,
116                                        &nv_value, sizep);
117         if (rc)
118                 return rc;
119
120         if (buf == NULL || buf->lb_buf == NULL) {
121                 /* return the required size by *sizep */
122                 return 0;
123         }
124
125         if (*sizep > buf->lb_len)
126                 return -ERANGE; /* match ldiskfs error */
127
128         memcpy(buf->lb_buf, nv_value, *sizep);
129         return 0;
130 }
131
132 int __osd_xattr_get_large(const struct lu_env *env, struct osd_device *osd,
133                           uint64_t xattr, struct lu_buf *buf,
134                           const char *name, int *sizep)
135 {
136         dnode_t         *xa_data_dn;
137         sa_handle_t *sa_hdl = NULL;
138         uint64_t         xa_data_obj, size;
139         int              rc;
140
141         /* are there any extended attributes? */
142         if (xattr == ZFS_NO_OBJECT)
143                 return -ENOENT;
144
145         /* Lookup the object number containing the xattr data */
146         rc = -zap_lookup(osd->od_os, xattr, name, sizeof(uint64_t), 1,
147                         &xa_data_obj);
148         if (rc)
149                 return rc;
150
151         rc = __osd_obj2dnode(osd->od_os, xa_data_obj, &xa_data_dn);
152         if (rc)
153                 return rc;
154
155         rc = -sa_handle_get(osd->od_os, xa_data_obj, NULL, SA_HDL_PRIVATE,
156                         &sa_hdl);
157         if (rc)
158                 goto out_rele;
159
160         /* Get the xattr value length / object size */
161         rc = -sa_lookup(sa_hdl, SA_ZPL_SIZE(osd), &size, 8);
162         if (rc)
163                 goto out;
164
165         if (size > INT_MAX) {
166                 rc = -EOVERFLOW;
167                 goto out;
168         }
169
170         *sizep = (int)size;
171
172         if (buf == NULL || buf->lb_buf == NULL) {
173                 /* We only need to return the required size */
174                 goto out;
175         }
176         if (*sizep > buf->lb_len) {
177                 rc = -ERANGE; /* match ldiskfs error */
178                 goto out;
179         }
180
181         rc = -dmu_read(osd->od_os, xa_data_dn->dn_object, 0,
182                         size, buf->lb_buf, DMU_READ_PREFETCH);
183
184 out:
185         sa_handle_destroy(sa_hdl);
186 out_rele:
187         osd_dnode_rele(xa_data_dn);
188
189         return rc;
190 }
191
192 /**
193  * Copy an extended attribute into the buffer provided, or compute
194  * the required buffer size if \a buf is NULL.
195  *
196  * On success, the number of bytes used or required is stored in \a sizep.
197  *
198  * Note that no locking is done here.
199  *
200  * \param[in] env      execution environment
201  * \param[in] obj      object for which to retrieve xattr
202  * \param[out] buf     buffer to store xattr value in
203  * \param[in] name     name of xattr to copy
204  * \param[out] sizep   bytes used or required to store xattr
205  *
206  * \retval 0           on success
207  * \retval negative    negated errno on failure
208  */
209 int osd_xattr_get_internal(const struct lu_env *env, struct osd_object *obj,
210                            struct lu_buf *buf, const char *name, int *sizep)
211 {
212         int rc;
213
214         if (unlikely(!dt_object_exists(&obj->oo_dt) || obj->oo_destroyed))
215                 return -ENOENT;
216
217         /* check SA_ZPL_DXATTR first then fallback to directory xattr */
218         rc = __osd_sa_xattr_get(env, obj, buf, name, sizep);
219         if (rc != -ENOENT)
220                 return rc;
221
222         return __osd_xattr_get_large(env, osd_obj2dev(obj), obj->oo_xattr,
223                                      buf, name, sizep);
224 }
225
226 static int osd_get_pfid_from_lma(const struct lu_env *env,
227                                  struct osd_object *obj,
228                                  struct lu_buf *buf, int *sizep)
229 {
230         struct osd_thread_info *info = osd_oti_get(env);
231         struct lustre_ost_attrs *loa =
232                 (struct lustre_ost_attrs *)&info->oti_buf;
233         struct lustre_mdt_attrs *lma = &loa->loa_lma;
234         struct filter_fid *ff;
235         struct ost_layout *ol;
236         struct lu_buf tbuf = {
237                 .lb_buf = loa,
238                 .lb_len = sizeof(info->oti_buf),
239         };
240         int rc;
241         ENTRY;
242
243         CLASSERT(sizeof(info->oti_buf) >= sizeof(*loa));
244         rc = osd_xattr_get_internal(env, obj, &tbuf,
245                                     XATTR_NAME_LMA, sizep);
246         if (rc)
247                 RETURN(rc);
248
249         lustre_loa_swab(loa, true);
250         LASSERT(lma->lma_compat & LMAC_STRIPE_INFO);
251
252         *sizep = sizeof(*ff);
253         if (buf->lb_len == 0 || !buf->lb_buf)
254                 RETURN(0);
255
256         if (buf->lb_len < *sizep)
257                 RETURN(-ERANGE);
258
259         ff = buf->lb_buf;
260         ol = &ff->ff_layout;
261         ol->ol_stripe_count = cpu_to_le32(loa->loa_parent_fid.f_ver >>
262                                           PFID_STRIPE_IDX_BITS);
263         ol->ol_stripe_size = cpu_to_le32(loa->loa_stripe_size);
264         loa->loa_parent_fid.f_ver &= PFID_STRIPE_COUNT_MASK;
265         fid_cpu_to_le(&ff->ff_parent, &loa->loa_parent_fid);
266         if (lma->lma_compat & LMAC_COMP_INFO) {
267                 ol->ol_comp_start = cpu_to_le64(loa->loa_comp_start);
268                 ol->ol_comp_end = cpu_to_le64(loa->loa_comp_end);
269                 ol->ol_comp_id = cpu_to_le32(loa->loa_comp_id);
270         } else {
271                 ol->ol_comp_start = 0;
272                 ol->ol_comp_end = 0;
273                 ol->ol_comp_id = 0;
274         }
275
276         RETURN(0);
277 }
278
279 int osd_xattr_get(const struct lu_env *env, struct dt_object *dt,
280                   struct lu_buf *buf, const char *name)
281 {
282         struct osd_object  *obj  = osd_dt_obj(dt);
283         int                 rc, size = 0;
284         ENTRY;
285
286         LASSERT(obj->oo_dn != NULL);
287         LASSERT(osd_invariant(obj));
288
289         if (!osd_obj2dev(obj)->od_posix_acl &&
290             (strcmp(name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
291              strcmp(name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0))
292                 RETURN(-EOPNOTSUPP);
293
294         down_read(&obj->oo_guard);
295         if (unlikely(!dt_object_exists(dt) || obj->oo_destroyed)) {
296                 up_read(&obj->oo_guard);
297                 RETURN(-ENOENT);
298         }
299
300         /* For the OST migrated from ldiskfs, the PFID EA may
301          * be stored in LMA because of ldiskfs inode size. */
302         if (strcmp(name, XATTR_NAME_FID) == 0 && obj->oo_pfid_in_lma)
303                 rc = osd_get_pfid_from_lma(env, obj, buf, &size);
304         else
305                 rc = osd_xattr_get_internal(env, obj, buf, name, &size);
306         up_read(&obj->oo_guard);
307
308         if (rc == -ENOENT)
309                 rc = -ENODATA;
310         else if (rc == 0)
311                 rc = size;
312         RETURN(rc);
313 }
314
315 /* the function is used to declare EAs when SA is not supported */
316 void __osd_xattr_declare_legacy(const struct lu_env *env,
317                                 struct osd_object *obj,
318                                 int vallen, const char *name,
319                                 struct osd_thandle *oh)
320 {
321         struct osd_device *osd = osd_obj2dev(obj);
322         dmu_tx_t *tx = oh->ot_tx;
323         uint64_t xa_data_obj;
324         int rc;
325
326         if (obj->oo_xattr == ZFS_NO_OBJECT) {
327                 /* xattr zap + entry */
328                 dmu_tx_hold_zap(tx, DMU_NEW_OBJECT, TRUE, (char *) name);
329                 /* xattr value obj */
330                 dmu_tx_hold_sa_create(tx, ZFS_SA_BASE_ATTR_SIZE);
331                 dmu_tx_hold_write(tx, DMU_NEW_OBJECT, 0, vallen);
332                 return;
333         }
334
335         rc = -zap_lookup(osd->od_os, obj->oo_xattr, name, sizeof(uint64_t), 1,
336                         &xa_data_obj);
337         if (rc == 0) {
338                 /*
339                  * Entry already exists.
340                  * We'll truncate the existing object.
341                  */
342                 dmu_tx_hold_bonus(tx, xa_data_obj);
343                 dmu_tx_hold_free(tx, xa_data_obj, vallen, DMU_OBJECT_END);
344                 dmu_tx_hold_write(tx, xa_data_obj, 0, vallen);
345         } else if (rc == -ENOENT) {
346                 /*
347                  * Entry doesn't exist, we need to create a new one and a new
348                  * object to store the value.
349                  */
350                 dmu_tx_hold_bonus(tx, obj->oo_xattr);
351                 dmu_tx_hold_zap(tx, obj->oo_xattr, TRUE, (char *) name);
352                 dmu_tx_hold_sa_create(tx, ZFS_SA_BASE_ATTR_SIZE);
353                 dmu_tx_hold_write(tx, DMU_NEW_OBJECT, 0, vallen);
354         }
355 }
356
357 void __osd_xattr_declare_set(const struct lu_env *env, struct osd_object *obj,
358                              int vallen, const char *name,
359                              struct osd_thandle *oh)
360 {
361         struct osd_device *osd = osd_obj2dev(obj);
362         dmu_tx_t *tx = oh->ot_tx;
363         int bonuslen;
364
365         if (unlikely(obj->oo_destroyed))
366                 return;
367
368         if (strcmp(name, XATTR_NAME_LINK) == 0 &&
369             osd->od_remote_parent_dir != ZFS_NO_OBJECT) {
370                 /* If some name entry resides on remote MDT, then will create
371                  * agent entry under remote parent. On the other hand, if the
372                  * remote entry will be removed, then related agent entry may
373                  * need to be removed from the remote parent. So there may be
374                  * kinds of cases, let's declare enough credits. The credits
375                  * for create agent entry is enough for remove case. */
376                 osd_tx_hold_zap(tx, osd->od_remote_parent_dir,
377                                 NULL, TRUE, NULL);
378         }
379
380         if (unlikely(!osd_obj2dev(obj)->od_xattr_in_sa)) {
381                 __osd_xattr_declare_legacy(env, obj, vallen, name, oh);
382                 return;
383         }
384
385         /* declare EA in SA */
386         if (dt_object_exists(&obj->oo_dt)) {
387                 LASSERT(obj->oo_sa_hdl);
388                 /* XXX: it should be possible to skip spill
389                  * declaration if specific EA is part of
390                  * bonus and doesn't grow */
391                 dmu_tx_hold_spill(tx, obj->oo_dn->dn_object);
392                 return;
393         }
394
395         bonuslen = osd_obj_bonuslen(obj);
396
397         /* the object doesn't exist, but we've declared bonus
398          * in osd_declare_object_create() yet */
399         if (obj->oo_ea_in_bonus > bonuslen) {
400                 /* spill has been declared already */
401         } else if (obj->oo_ea_in_bonus + vallen > bonuslen) {
402                 /* we're about to exceed bonus, let's declare spill */
403                 dmu_tx_hold_spill(tx, DMU_NEW_OBJECT);
404         }
405         obj->oo_ea_in_bonus += vallen;
406 }
407
408 int osd_declare_xattr_set(const struct lu_env *env, struct dt_object *dt,
409                           const struct lu_buf *buf, const char *name,
410                           int fl, struct thandle *handle)
411 {
412         struct osd_object  *obj = osd_dt_obj(dt);
413         struct osd_thandle *oh;
414         ENTRY;
415
416         LASSERT(handle != NULL);
417         oh = container_of0(handle, struct osd_thandle, ot_super);
418
419         down_read(&obj->oo_guard);
420         __osd_xattr_declare_set(env, obj, buf->lb_len, name, oh);
421         up_read(&obj->oo_guard);
422
423         RETURN(0);
424 }
425
426 int __osd_sa_attr_init(const struct lu_env *env, struct osd_object *obj,
427                        struct osd_thandle *oh)
428 {
429         sa_bulk_attr_t  *bulk = osd_oti_get(env)->oti_attr_bulk;
430         struct osa_attr *osa = &osd_oti_get(env)->oti_osa;
431         struct lu_buf *lb = &osd_oti_get(env)->oti_xattr_lbuf;
432         struct osd_device *osd = osd_obj2dev(obj);
433         uint64_t crtime[2], gen;
434         timestruc_t now;
435         size_t size;
436         int rc, cnt;
437
438         obj->oo_late_xattr = 0;
439         obj->oo_late_attr_set = 0;
440
441         gen = dmu_tx_get_txg(oh->ot_tx);
442         gethrestime(&now);
443         ZFS_TIME_ENCODE(&now, crtime);
444
445         osa->atime[0] = obj->oo_attr.la_atime;
446         osa->ctime[0] = obj->oo_attr.la_ctime;
447         osa->mtime[0] = obj->oo_attr.la_mtime;
448         osa->mode = obj->oo_attr.la_mode;
449         osa->uid = obj->oo_attr.la_uid;
450         osa->gid = obj->oo_attr.la_gid;
451         osa->rdev = obj->oo_attr.la_rdev;
452         osa->nlink = obj->oo_attr.la_nlink;
453         osa->flags = attrs_fs2zfs(obj->oo_attr.la_flags);
454         osa->size  = obj->oo_attr.la_size;
455 #ifdef ZFS_PROJINHERIT
456         if (osd->od_projectused_dn) {
457                 if (obj->oo_attr.la_valid & LA_PROJID)
458                         osa->projid = obj->oo_attr.la_projid;
459                 else
460                         osa->projid = ZFS_DEFAULT_PROJID;
461                 osa->flags |= ZFS_PROJID;
462                 obj->oo_with_projid = 1;
463         }
464 #endif
465
466         cnt = 0;
467         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_MODE(osd), NULL, &osa->mode, 8);
468         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_SIZE(osd), NULL, &osa->size, 8);
469         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_GEN(osd), NULL, &gen, 8);
470         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_UID(osd), NULL, &osa->uid, 8);
471         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_GID(osd), NULL, &osa->gid, 8);
472         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_PARENT(osd), NULL,
473                          &obj->oo_parent, 8);
474         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_FLAGS(osd), NULL, &osa->flags, 8);
475         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_ATIME(osd), NULL, osa->atime, 16);
476         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_MTIME(osd), NULL, osa->mtime, 16);
477         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_CTIME(osd), NULL, osa->ctime, 16);
478         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_CRTIME(osd), NULL, crtime, 16);
479         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_LINKS(osd), NULL, &osa->nlink, 8);
480 #ifdef ZFS_PROJINHERIT
481         if (osd->od_projectused_dn)
482                 SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_PROJID(osd), NULL,
483                                  &osa->projid, 8);
484 #endif
485         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_RDEV(osd), NULL, &osa->rdev, 8);
486         LASSERT(cnt <= ARRAY_SIZE(osd_oti_get(env)->oti_attr_bulk));
487
488         /* Update the SA for additions, modifications, and removals. */
489         rc = -nvlist_size(obj->oo_sa_xattr, &size, NV_ENCODE_XDR);
490         if (rc)
491                 return rc;
492
493         lu_buf_check_and_alloc(lb, size);
494         if (lb->lb_buf == NULL) {
495                 CERROR("%s: can't allocate buffer for xattr update\n",
496                                 osd->od_svname);
497                 return -ENOMEM;
498         }
499
500         rc = -nvlist_pack(obj->oo_sa_xattr, (char **)&lb->lb_buf, &size,
501                           NV_ENCODE_XDR, KM_SLEEP);
502         if (rc)
503                 return rc;
504
505         SA_ADD_BULK_ATTR(bulk, cnt, SA_ZPL_DXATTR(osd), NULL, lb->lb_buf, size);
506
507         rc = -sa_replace_all_by_template(obj->oo_sa_hdl, bulk, cnt, oh->ot_tx);
508
509         return rc;
510 }
511
512 int __osd_sa_xattr_update(const struct lu_env *env, struct osd_object *obj,
513                            struct osd_thandle *oh)
514 {
515         struct lu_buf     *lb = &osd_oti_get(env)->oti_xattr_lbuf;
516         struct osd_device *osd = osd_obj2dev(obj);
517         char              *dxattr;
518         size_t             size;
519         int                rc;
520
521         obj->oo_late_xattr = 0;
522
523         /* Update the SA for additions, modifications, and removals. */
524         rc = -nvlist_size(obj->oo_sa_xattr, &size, NV_ENCODE_XDR);
525         if (rc)
526                 return rc;
527
528         lu_buf_check_and_alloc(lb, size);
529         if (lb->lb_buf == NULL) {
530                 CERROR("%s: can't allocate buffer for xattr update\n",
531                                 osd->od_svname);
532                 return -ENOMEM;
533         }
534
535         dxattr = lb->lb_buf;
536         rc = -nvlist_pack(obj->oo_sa_xattr, &dxattr, &size,
537                         NV_ENCODE_XDR, KM_SLEEP);
538         if (rc)
539                 return rc;
540         LASSERT(dxattr == lb->lb_buf);
541
542         sa_update(obj->oo_sa_hdl, SA_ZPL_DXATTR(osd), dxattr, size, oh->ot_tx);
543
544         return 0;
545 }
546
547 /*
548  * Set an extended attribute.
549  * This transaction must have called udmu_xattr_declare_set() first.
550  *
551  * Returns 0 on success or a negative error number on failure.
552  *
553  * No locking is done here.
554  */
555 int __osd_sa_xattr_schedule_update(const struct lu_env *env,
556                                    struct osd_object *obj,
557                                    struct osd_thandle *oh)
558 {
559         ENTRY;
560         LASSERT(obj->oo_sa_hdl);
561         LASSERT(obj->oo_sa_xattr);
562
563         /* schedule batched SA update in osd_object_sa_dirty_rele() */
564         obj->oo_late_xattr = 1;
565         osd_object_sa_dirty_add(obj, oh);
566
567         RETURN(0);
568
569 }
570
571 int __osd_sa_xattr_set(const struct lu_env *env, struct osd_object *obj,
572                        const struct lu_buf *buf, const char *name, int fl,
573                        struct osd_thandle *oh)
574 {
575         uchar_t *nv_value;
576         size_t  size;
577         int     nv_size;
578         int     rc;
579         int     too_big = 0;
580
581         rc = __osd_xattr_cache(obj);
582         if (rc)
583                 return rc;
584
585         LASSERT(obj->oo_sa_xattr);
586         /* Limited to 32k to keep nvpair memory allocations small */
587         if (buf->lb_len > DXATTR_MAX_ENTRY_SIZE) {
588                 too_big = 1;
589         } else {
590                 /* Prevent the DXATTR SA from consuming the entire SA
591                  * region */
592                 rc = -nvlist_size(obj->oo_sa_xattr, &size, NV_ENCODE_XDR);
593                 if (rc)
594                         return rc;
595
596                 if (size + buf->lb_len > DXATTR_MAX_SA_SIZE)
597                         too_big = 1;
598         }
599
600         /* even in case of -EFBIG we must lookup xattr and check can we
601          * rewrite it then delete from SA */
602         rc = -nvlist_lookup_byte_array(obj->oo_sa_xattr, name, &nv_value,
603                                         &nv_size);
604         if (rc == 0) {
605                 if (fl & LU_XATTR_CREATE) {
606                         return -EEXIST;
607                 } else if (too_big) {
608                         rc = -nvlist_remove(obj->oo_sa_xattr, name,
609                                                 DATA_TYPE_BYTE_ARRAY);
610                         if (rc < 0)
611                                 return rc;
612                         rc = __osd_sa_xattr_schedule_update(env, obj, oh);
613                         return rc == 0 ? -EFBIG : rc;
614                 }
615         } else if (rc == -ENOENT) {
616                 if (fl & LU_XATTR_REPLACE)
617                         return -ENODATA;
618                 else if (too_big)
619                         return -EFBIG;
620         } else {
621                 return rc;
622         }
623
624         /* Ensure xattr doesn't exist in ZAP */
625         if (obj->oo_xattr != ZFS_NO_OBJECT) {
626                 struct osd_device *osd = osd_obj2dev(obj);
627                 uint64_t           objid;
628                 rc = -zap_lookup(osd->od_os, obj->oo_xattr,
629                                  name, 8, 1, &objid);
630                 if (rc == 0) {
631                         rc = -dmu_object_free(osd->od_os, objid, oh->ot_tx);
632                         if (rc == 0)
633                                 zap_remove(osd->od_os, obj->oo_xattr,
634                                            name, oh->ot_tx);
635                 }
636         }
637
638         rc = -nvlist_add_byte_array(obj->oo_sa_xattr, name,
639                                     (uchar_t *)buf->lb_buf, buf->lb_len);
640         if (rc)
641                 return rc;
642
643         /* batch updates only for just created dnodes where we
644          * used to set number of EAs in a single transaction */
645         if (obj->oo_dn->dn_allocated_txg == oh->ot_tx->tx_txg)
646                 rc = __osd_sa_xattr_schedule_update(env, obj, oh);
647         else
648                 rc = __osd_sa_xattr_update(env, obj, oh);
649
650         return rc;
651 }
652
653 int
654 __osd_xattr_set(const struct lu_env *env, struct osd_object *obj,
655                 const struct lu_buf *buf, const char *name, int fl,
656                 struct osd_thandle *oh)
657 {
658         struct osd_device *osd = osd_obj2dev(obj);
659         dnode_t *xa_zap_dn = NULL;
660         dnode_t *xa_data_dn = NULL;
661         uint64_t           xa_data_obj;
662         sa_handle_t       *sa_hdl = NULL;
663         dmu_tx_t          *tx = oh->ot_tx;
664         uint64_t           size;
665         int                rc;
666
667         LASSERT(obj->oo_sa_hdl);
668
669         if (obj->oo_xattr == ZFS_NO_OBJECT) {
670                 struct lu_attr *la = &osd_oti_get(env)->oti_la;
671
672                 la->la_valid = LA_MODE;
673                 la->la_mode = S_IFDIR | S_IRUGO | S_IWUSR | S_IXUGO;
674                 rc = __osd_zap_create(env, osd, &xa_zap_dn, tx, la, 0, 0);
675                 if (rc)
676                         return rc;
677
678                 obj->oo_xattr = xa_zap_dn->dn_object;
679                 rc = osd_object_sa_update(obj, SA_ZPL_XATTR(osd),
680                                 &obj->oo_xattr, 8, oh);
681                 if (rc)
682                         goto out;
683         }
684
685         rc = -zap_lookup(osd->od_os, obj->oo_xattr, name, sizeof(uint64_t), 1,
686                          &xa_data_obj);
687         if (rc == 0) {
688                 if (fl & LU_XATTR_CREATE) {
689                         rc = -EEXIST;
690                         goto out;
691                 }
692                 /*
693                  * Entry already exists.
694                  * We'll truncate the existing object.
695                  */
696                 rc = __osd_obj2dnode(osd->od_os, xa_data_obj, &xa_data_dn);
697                 if (rc)
698                         goto out;
699
700                 rc = -sa_handle_get(osd->od_os, xa_data_obj, NULL,
701                                         SA_HDL_PRIVATE, &sa_hdl);
702                 if (rc)
703                         goto out;
704
705                 rc = -sa_lookup(sa_hdl, SA_ZPL_SIZE(osd), &size, 8);
706                 if (rc)
707                         goto out_sa;
708
709                 rc = -dmu_free_range(osd->od_os, xa_data_dn->dn_object,
710                                      0, DMU_OBJECT_END, tx);
711                 if (rc)
712                         goto out_sa;
713         } else if (rc == -ENOENT) {
714                 struct lu_attr *la = &osd_oti_get(env)->oti_la;
715                 /*
716                  * Entry doesn't exist, we need to create a new one and a new
717                  * object to store the value.
718                  */
719                 if (fl & LU_XATTR_REPLACE) {
720                         /* should be ENOATTR according to the
721                          * man, but that is undefined here */
722                         rc = -ENODATA;
723                         goto out;
724                 }
725
726                 la->la_valid = LA_MODE;
727                 la->la_mode = S_IFREG | S_IRUGO | S_IWUSR;
728                 rc = __osd_object_create(env, osd, obj,
729                                          lu_object_fid(&obj->oo_dt.do_lu),
730                                          &xa_data_dn, tx, la);
731                 if (rc)
732                         goto out;
733                 xa_data_obj = xa_data_dn->dn_object;
734
735                 rc = -sa_handle_get(osd->od_os, xa_data_obj, NULL,
736                                         SA_HDL_PRIVATE, &sa_hdl);
737                 if (rc)
738                         goto out;
739
740                 rc = -zap_add(osd->od_os, obj->oo_xattr, name, sizeof(uint64_t),
741                                 1, &xa_data_obj, tx);
742                 if (rc)
743                         goto out_sa;
744         } else {
745                 /* There was an error looking up the xattr name */
746                 goto out;
747         }
748
749         /* Finally write the xattr value */
750         dmu_write(osd->od_os, xa_data_obj, 0, buf->lb_len, buf->lb_buf, tx);
751
752         size = buf->lb_len;
753         rc = -sa_update(sa_hdl, SA_ZPL_SIZE(osd), &size, 8, tx);
754
755 out_sa:
756         sa_handle_destroy(sa_hdl);
757 out:
758         if (xa_data_dn != NULL)
759                 osd_dnode_rele(xa_data_dn);
760         if (xa_zap_dn != NULL)
761                 osd_dnode_rele(xa_zap_dn);
762
763         return rc;
764 }
765
766 static int osd_xattr_split_pfid(const struct lu_env *env,
767                                 struct osd_object *obj, struct osd_thandle *oh)
768 {
769         struct osd_thread_info *info = osd_oti_get(env);
770         struct lustre_ost_attrs *loa =
771                 (struct lustre_ost_attrs *)&info->oti_buf;
772         struct lustre_mdt_attrs *lma = &loa->loa_lma;
773         struct lu_buf buf = {
774                 .lb_buf = loa,
775                 .lb_len = sizeof(info->oti_buf),
776         };
777         int size;
778         int rc;
779         ENTRY;
780
781         CLASSERT(sizeof(info->oti_buf) >= sizeof(*loa));
782         rc = osd_xattr_get_internal(env, obj, &buf, XATTR_NAME_LMA, &size);
783         if (rc)
784                 RETURN(rc);
785
786         lustre_loa_swab(loa, true);
787         LASSERT(lma->lma_compat & LMAC_STRIPE_INFO);
788
789         lma->lma_compat &= ~(LMAC_STRIPE_INFO | LMAC_COMP_INFO);
790         lustre_lma_swab(lma);
791         buf.lb_buf = lma;
792         buf.lb_len = sizeof(*lma);
793         rc = osd_xattr_set_internal(env, obj, &buf, XATTR_NAME_LMA,
794                                     LU_XATTR_REPLACE, oh);
795         if (!rc)
796                 obj->oo_pfid_in_lma = 0;
797
798         RETURN(rc);
799 }
800
801 /*
802  * In DNE environment, the object (in spite of regular file or directory)
803  * and its name entry may reside on different MDTs. Under such case, we will
804  * create an agent entry on the MDT where the object resides. The agent entry
805  * references the object locally, that makes the object to be visible to the
806  * userspace when mounted as 'zfs' directly. Then the userspace tools, such
807  * as 'tar' can handle the object properly.
808  *
809  * We handle the agent entry during set linkEA that is the common interface
810  * for both regular file and directroy, can handle kinds of cases, such as
811  * create/link/unlink/rename, and so on.
812  *
813  * NOTE: we need to do that for both directory and regular file, so we can NOT
814  *       do that when ea_{insert,delete} that are directory based operations.
815  */
816 static int osd_xattr_handle_linkea(const struct lu_env *env,
817                                    struct osd_device *osd,
818                                    struct osd_object *obj,
819                                    const struct lu_buf *buf,
820                                    struct osd_thandle *oh)
821 {
822         const struct lu_fid *fid = lu_object_fid(&obj->oo_dt.do_lu);
823         struct lu_fid *tfid = &osd_oti_get(env)->oti_fid;
824         struct linkea_data ldata = { .ld_buf = (struct lu_buf *)buf };
825         struct lu_name tmpname;
826         int rc;
827         bool remote = false;
828         ENTRY;
829
830         rc = linkea_init_with_rec(&ldata);
831         if (!rc) {
832                 linkea_first_entry(&ldata);
833                 while (ldata.ld_lee != NULL && !remote) {
834                         linkea_entry_unpack(ldata.ld_lee, &ldata.ld_reclen,
835                                             &tmpname, tfid);
836                         if (osd_remote_fid(env, osd, tfid) > 0)
837                                 remote = true;
838                         else
839                                 linkea_next_entry(&ldata);
840                 }
841         } else if (rc == -ENODATA) {
842                 rc = 0;
843         } else {
844                 RETURN(rc);
845         }
846
847         if (lu_object_has_agent_entry(&obj->oo_dt.do_lu) && !remote) {
848                 rc = osd_delete_from_remote_parent(env, osd, obj, oh, false);
849                 if (rc)
850                         CERROR("%s: failed to remove agent entry for "DFID
851                                ": rc = %d\n", osd_name(osd), PFID(fid), rc);
852         } else if (!lu_object_has_agent_entry(&obj->oo_dt.do_lu) && remote) {
853                 rc = osd_add_to_remote_parent(env, osd, obj, oh);
854                 if (rc)
855                         CWARN("%s: failed to create agent entry for "DFID
856                               ": rc = %d\n", osd_name(osd), PFID(fid), rc);
857         }
858
859         RETURN(rc);
860 }
861
862 int osd_xattr_set(const struct lu_env *env, struct dt_object *dt,
863                   const struct lu_buf *buf, const char *name, int fl,
864                   struct thandle *handle)
865 {
866         struct osd_object *obj = osd_dt_obj(dt);
867         struct osd_device *osd = osd_obj2dev(obj);
868         struct osd_thandle *oh;
869         int rc = 0;
870         ENTRY;
871
872         LASSERT(handle != NULL);
873         LASSERT(osd_invariant(obj));
874
875         if (!osd_obj2dev(obj)->od_posix_acl &&
876             (strcmp(name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
877              strcmp(name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0))
878                 RETURN(-EOPNOTSUPP);
879
880         oh = container_of0(handle, struct osd_thandle, ot_super);
881
882         down_write(&obj->oo_guard);
883         CDEBUG(D_INODE, "Setting xattr %s with size %d\n",
884                 name, (int)buf->lb_len);
885         /* For the OST migrated from ldiskfs, the PFID EA may
886          * be stored in LMA because of ldiskfs inode size. */
887         if (unlikely(strcmp(name, XATTR_NAME_FID) == 0 &&
888                      obj->oo_pfid_in_lma)) {
889                 rc = osd_xattr_split_pfid(env, obj, oh);
890                 if (!rc)
891                         fl = LU_XATTR_CREATE;
892         } else if (strcmp(name, XATTR_NAME_LINK) == 0 &&
893                    osd->od_remote_parent_dir != ZFS_NO_OBJECT) {
894                 rc = osd_xattr_handle_linkea(env, osd, obj, buf, oh);
895         }
896
897         if (!rc)
898                 rc = osd_xattr_set_internal(env, obj, buf, name, fl, oh);
899         up_write(&obj->oo_guard);
900
901         RETURN(rc);
902 }
903
904 static void
905 __osd_xattr_declare_del(const struct lu_env *env, struct osd_object *obj,
906                         const char *name, struct osd_thandle *oh)
907 {
908         struct osd_device *osd = osd_obj2dev(obj);
909         dmu_tx_t          *tx = oh->ot_tx;
910         uint64_t           xa_data_obj;
911         int                rc;
912
913         /* update SA_ZPL_DXATTR if xattr was in SA */
914         dmu_tx_hold_sa(tx, obj->oo_sa_hdl, 0);
915
916         if (obj->oo_xattr == ZFS_NO_OBJECT)
917                 return;
918
919         rc = -zap_lookup(osd->od_os, obj->oo_xattr, name, 8, 1, &xa_data_obj);
920         if (rc == 0) {
921                 /*
922                  * Entry exists.
923                  * We'll delete the existing object and ZAP entry.
924                  */
925                 dmu_tx_hold_bonus(tx, xa_data_obj);
926                 dmu_tx_hold_free(tx, xa_data_obj, 0, DMU_OBJECT_END);
927                 dmu_tx_hold_zap(tx, obj->oo_xattr, FALSE, (char *) name);
928                 return;
929         } else if (rc == -ENOENT) {
930                 /*
931                  * Entry doesn't exist, nothing to be changed.
932                  */
933                 return;
934         }
935
936         /* An error happened */
937         tx->tx_err = -rc;
938 }
939
940 int osd_declare_xattr_del(const struct lu_env *env, struct dt_object *dt,
941                           const char *name, struct thandle *handle)
942 {
943         struct osd_object  *obj = osd_dt_obj(dt);
944         struct osd_thandle *oh;
945         ENTRY;
946
947         LASSERT(handle != NULL);
948         LASSERT(osd_invariant(obj));
949
950         oh = container_of0(handle, struct osd_thandle, ot_super);
951         LASSERT(oh->ot_tx != NULL);
952         LASSERT(obj->oo_dn != NULL);
953
954         down_read(&obj->oo_guard);
955         if (likely(dt_object_exists(&obj->oo_dt) && !obj->oo_destroyed))
956                 __osd_xattr_declare_del(env, obj, name, oh);
957         up_read(&obj->oo_guard);
958
959         RETURN(0);
960 }
961
962 static int __osd_sa_xattr_del(const struct lu_env *env, struct osd_object *obj,
963                               const char *name, struct osd_thandle *oh)
964 {
965         int rc;
966
967         rc = __osd_xattr_cache(obj);
968         if (rc)
969                 return rc;
970
971         rc = -nvlist_remove(obj->oo_sa_xattr, name, DATA_TYPE_BYTE_ARRAY);
972         if (rc == 0)
973                 rc = __osd_sa_xattr_schedule_update(env, obj, oh);
974         return rc;
975 }
976
977 static int __osd_xattr_del(const struct lu_env *env, struct osd_object *obj,
978                            const char *name, struct osd_thandle *oh)
979 {
980         struct osd_device *osd = osd_obj2dev(obj);
981         uint64_t           xa_data_obj;
982         int                rc;
983
984         if (unlikely(!dt_object_exists(&obj->oo_dt) || obj->oo_destroyed))
985                 return -ENOENT;
986
987         /* try remove xattr from SA at first */
988         rc = __osd_sa_xattr_del(env, obj, name, oh);
989         if (rc != -ENOENT)
990                 return rc;
991
992         if (obj->oo_xattr == ZFS_NO_OBJECT)
993                 return 0;
994
995         rc = -zap_lookup(osd->od_os, obj->oo_xattr, name, sizeof(uint64_t), 1,
996                         &xa_data_obj);
997         if (rc == -ENOENT) {
998                 rc = 0;
999         } else if (rc == 0) {
1000                 /*
1001                  * Entry exists.
1002                  * We'll delete the existing object and ZAP entry.
1003                  */
1004                 rc = -dmu_object_free(osd->od_os, xa_data_obj, oh->ot_tx);
1005                 if (rc)
1006                         return rc;
1007
1008                 rc = -zap_remove(osd->od_os, obj->oo_xattr, name, oh->ot_tx);
1009         }
1010
1011         return rc;
1012 }
1013
1014 int osd_xattr_del(const struct lu_env *env, struct dt_object *dt,
1015                   const char *name, struct thandle *handle)
1016 {
1017         struct osd_object  *obj = osd_dt_obj(dt);
1018         struct osd_thandle *oh;
1019         int                 rc;
1020         ENTRY;
1021
1022         LASSERT(handle != NULL);
1023         LASSERT(obj->oo_dn != NULL);
1024         LASSERT(osd_invariant(obj));
1025         LASSERT(dt_object_exists(dt));
1026         oh = container_of0(handle, struct osd_thandle, ot_super);
1027         LASSERT(oh->ot_tx != NULL);
1028
1029         if (!osd_obj2dev(obj)->od_posix_acl &&
1030             (strcmp(name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
1031              strcmp(name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0))
1032                 RETURN(-EOPNOTSUPP);
1033
1034         down_write(&obj->oo_guard);
1035         /* For the OST migrated from ldiskfs, the PFID EA may
1036          * be stored in LMA because of ldiskfs inode size. */
1037         if (unlikely(strcmp(name, XATTR_NAME_FID) == 0 && obj->oo_pfid_in_lma))
1038                 rc = osd_xattr_split_pfid(env, obj, oh);
1039         else
1040                 rc = __osd_xattr_del(env, obj, name, oh);
1041         up_write(&obj->oo_guard);
1042
1043         RETURN(rc);
1044 }
1045
1046 void osd_declare_xattrs_destroy(const struct lu_env *env,
1047                                 struct osd_object *obj, struct osd_thandle *oh)
1048 {
1049         struct osd_device *osd = osd_obj2dev(obj);
1050         zap_attribute_t   *za = &osd_oti_get(env)->oti_za;
1051         uint64_t           oid = obj->oo_xattr, xid;
1052         dmu_tx_t          *tx = oh->ot_tx;
1053         zap_cursor_t      *zc;
1054         int                rc;
1055
1056         if (oid == ZFS_NO_OBJECT)
1057                 return; /* Nothing to do for SA xattrs */
1058
1059         /* Declare to free the ZAP holding xattrs */
1060         dmu_tx_hold_free(tx, oid, 0, DMU_OBJECT_END);
1061
1062         rc = osd_zap_cursor_init(&zc, osd->od_os, oid, 0);
1063         if (rc)
1064                 goto out;
1065
1066         while (zap_cursor_retrieve(zc, za) == 0) {
1067                 LASSERT(za->za_num_integers == 1);
1068                 LASSERT(za->za_integer_length == sizeof(uint64_t));
1069
1070                 rc = -zap_lookup(osd->od_os, oid, za->za_name,
1071                                  sizeof(uint64_t), 1, &xid);
1072                 if (rc) {
1073                         CERROR("%s: xattr %s lookup failed: rc = %d\n",
1074                                osd->od_svname, za->za_name, rc);
1075                         break;
1076                 }
1077                 dmu_tx_hold_free(tx, xid, 0, DMU_OBJECT_END);
1078
1079                 zap_cursor_advance(zc);
1080         }
1081
1082         osd_zap_cursor_fini(zc);
1083 out:
1084         if (rc && tx->tx_err == 0)
1085                 tx->tx_err = -rc;
1086 }
1087
1088 int osd_xattrs_destroy(const struct lu_env *env,
1089                        struct osd_object *obj, struct osd_thandle *oh)
1090 {
1091         struct osd_device *osd = osd_obj2dev(obj);
1092         dmu_tx_t          *tx = oh->ot_tx;
1093         zap_attribute_t   *za = &osd_oti_get(env)->oti_za;
1094         zap_cursor_t      *zc;
1095         uint64_t           xid;
1096         int                rc;
1097
1098         /* The transaction must have been assigned to a transaction group. */
1099         LASSERT(tx->tx_txg != 0);
1100
1101         if (obj->oo_xattr == ZFS_NO_OBJECT)
1102                 return 0; /* Nothing to do for SA xattrs */
1103
1104         /* Free the ZAP holding the xattrs */
1105         rc = osd_zap_cursor_init(&zc, osd->od_os, obj->oo_xattr, 0);
1106         if (rc)
1107                 return rc;
1108
1109         while (zap_cursor_retrieve(zc, za) == 0) {
1110                 LASSERT(za->za_num_integers == 1);
1111                 LASSERT(za->za_integer_length == sizeof(uint64_t));
1112
1113                 rc = -zap_lookup(osd->od_os, obj->oo_xattr, za->za_name,
1114                                  sizeof(uint64_t), 1, &xid);
1115                 if (rc) {
1116                         CERROR("%s: lookup xattr %s failed: rc = %d\n",
1117                                osd->od_svname, za->za_name, rc);
1118                 } else {
1119                         rc = -dmu_object_free(osd->od_os, xid, tx);
1120                         if (rc)
1121                                 CERROR("%s: free xattr %s failed: rc = %d\n",
1122                                        osd->od_svname, za->za_name, rc);
1123                 }
1124                 zap_cursor_advance(zc);
1125         }
1126         osd_zap_cursor_fini(zc);
1127
1128         rc = -dmu_object_free(osd->od_os, obj->oo_xattr, tx);
1129         if (rc)
1130                 CERROR("%s: free xattr %llu failed: rc = %d\n",
1131                        osd->od_svname, obj->oo_xattr, rc);
1132
1133         return rc;
1134 }
1135
1136 static int
1137 osd_sa_xattr_list(const struct lu_env *env, struct osd_object *obj,
1138                   const struct lu_buf *lb)
1139 {
1140         nvpair_t *nvp = NULL;
1141         int       len, counted = 0;
1142         int       rc = 0;
1143
1144         rc = __osd_xattr_cache(obj);
1145         if (rc)
1146                 return rc;
1147
1148         while ((nvp = nvlist_next_nvpair(obj->oo_sa_xattr, nvp)) != NULL) {
1149                 const char *name = nvpair_name(nvp);
1150
1151                 if (!osd_obj2dev(obj)->od_posix_acl &&
1152                     (strcmp(name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
1153                      strcmp(name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0))
1154                         continue;
1155
1156                 len = strlen(name);
1157                 if (lb->lb_buf != NULL) {
1158                         if (counted + len + 1 > lb->lb_len)
1159                                 return -ERANGE;
1160
1161                         memcpy(lb->lb_buf + counted, name, len + 1);
1162                 }
1163                 counted += len + 1;
1164         }
1165         return counted;
1166 }
1167
1168 int osd_xattr_list(const struct lu_env *env, struct dt_object *dt,
1169                    const struct lu_buf *lb)
1170 {
1171         struct osd_object      *obj = osd_dt_obj(dt);
1172         struct osd_device      *osd = osd_obj2dev(obj);
1173         zap_attribute_t        *za = &osd_oti_get(env)->oti_za;
1174         zap_cursor_t           *zc;
1175         int                    rc, counted;
1176         ENTRY;
1177
1178         LASSERT(obj->oo_dn != NULL);
1179         LASSERT(osd_invariant(obj));
1180         LASSERT(dt_object_exists(dt));
1181
1182         down_read(&obj->oo_guard);
1183
1184         rc = osd_sa_xattr_list(env, obj, lb);
1185         if (rc < 0)
1186                 GOTO(out, rc);
1187
1188         counted = rc;
1189
1190         /* continue with dnode xattr if any */
1191         if (obj->oo_xattr == ZFS_NO_OBJECT)
1192                 GOTO(out, rc = counted);
1193
1194         rc = osd_zap_cursor_init(&zc, osd->od_os, obj->oo_xattr, 0);
1195         if (rc)
1196                 GOTO(out, rc);
1197
1198         while ((rc = -zap_cursor_retrieve(zc, za)) == 0) {
1199                 if (!osd_obj2dev(obj)->od_posix_acl &&
1200                     (strcmp(za->za_name, XATTR_NAME_POSIX_ACL_ACCESS) == 0 ||
1201                      strcmp(za->za_name, XATTR_NAME_POSIX_ACL_DEFAULT) == 0)) {
1202                         zap_cursor_advance(zc);
1203                         continue;
1204                 }
1205
1206                 rc = strlen(za->za_name);
1207                 if (lb->lb_buf != NULL) {
1208                         if (counted + rc + 1 > lb->lb_len)
1209                                 GOTO(out_fini, rc = -ERANGE);
1210
1211                         memcpy(lb->lb_buf + counted, za->za_name, rc + 1);
1212                 }
1213                 counted += rc + 1;
1214
1215                 zap_cursor_advance(zc);
1216         }
1217         if (rc == -ENOENT) /* no more kes in the index */
1218                 rc = 0;
1219         else if (unlikely(rc < 0))
1220                 GOTO(out_fini, rc);
1221         rc = counted;
1222
1223 out_fini:
1224         osd_zap_cursor_fini(zc);
1225 out:
1226         up_read(&obj->oo_guard);
1227         RETURN(rc);
1228
1229 }