Whamcloud - gitweb
245b5d89cec3eed3064106984b29d2be1d4e37dc
[fs/lustre-release.git] / lustre / ofd / ofd_objects.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2009, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2012, 2014 Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/ofd/ofd_objects.c
33  *
34  * This file contains OSD API methods related to OBD Filter Device (OFD)
35  * object operations.
36  *
37  * Author: Alex Zhuravlev <alexey.zhuravlev@intel.com>
38  * Author: Mikhail Pershin <mike.pershin@intel.com>
39  */
40
41 #define DEBUG_SUBSYSTEM S_FILTER
42
43 #include <dt_object.h>
44 #include <lustre/lustre_idl.h>
45 #include <lustre_lfsck.h>
46
47 #include "ofd_internal.h"
48
49 /**
50  * Get object version from disk and check it.
51  *
52  * This function checks object version from disk with
53  * ofd_thread_info::fti_pre_version filled from incoming RPC. This is part of
54  * VBR (Version-Based Recovery) and ensures that object has the same version
55  * upon replay as it has during original modification.
56  *
57  * \param[in]  info     execution thread OFD private data
58  * \param[in]  fo       OFD object
59  *
60  * \retval              0 if version matches
61  * \retval              -EOVERFLOW on version mismatch
62  */
63 int ofd_version_get_check(struct ofd_thread_info *info,
64                           struct ofd_object *fo)
65 {
66         dt_obj_version_t curr_version;
67
68         LASSERT(ofd_object_exists(fo));
69
70         if (info->fti_exp == NULL)
71                 RETURN(0);
72
73         curr_version = dt_version_get(info->fti_env, ofd_object_child(fo));
74         if ((__s64)curr_version == -EOPNOTSUPP)
75                 RETURN(0);
76         /* VBR: version is checked always because costs nothing */
77         if (info->fti_pre_version != 0 &&
78             info->fti_pre_version != curr_version) {
79                 CDEBUG(D_INODE, "Version mismatch "LPX64" != "LPX64"\n",
80                        info->fti_pre_version, curr_version);
81                 spin_lock(&info->fti_exp->exp_lock);
82                 info->fti_exp->exp_vbr_failed = 1;
83                 spin_unlock(&info->fti_exp->exp_lock);
84                 RETURN (-EOVERFLOW);
85         }
86         info->fti_pre_version = curr_version;
87         RETURN(0);
88 }
89
90 /**
91  * Get OFD object by FID.
92  *
93  * This function finds OFD slice of compound object with the given FID.
94  *
95  * \param[in] env       execution environment
96  * \param[in] ofd       OFD device
97  * \param[in] fid       FID of the object
98  *
99  * \retval              pointer to the found ofd_object
100  * \retval              ERR_PTR(errno) in case of error
101  */
102 struct ofd_object *ofd_object_find(const struct lu_env *env,
103                                    struct ofd_device *ofd,
104                                    const struct lu_fid *fid)
105 {
106         struct ofd_object *fo;
107         struct lu_object  *o;
108
109         ENTRY;
110
111         o = lu_object_find(env, &ofd->ofd_dt_dev.dd_lu_dev, fid, NULL);
112         if (likely(!IS_ERR(o)))
113                 fo = ofd_obj(o);
114         else
115                 fo = ERR_CAST(o); /* return error */
116
117         RETURN(fo);
118 }
119
120 /**
121  * Get FID of parent MDT object.
122  *
123  * This function reads extended attribute XATTR_NAME_FID of OFD object which
124  * contains the MDT parent object FID and saves it in ofd_object::ofo_pfid.
125  *
126  * The filter_fid::ff_parent::f_ver field currently holds
127  * the OST-object index in the parent MDT-object's layout EA,
128  * not the actual FID::f_ver of the parent. We therefore access
129  * it via the macro f_stripe_idx.
130  *
131  * \param[in] env       execution environment
132  * \param[in] fo        OFD object
133  *
134  * \retval              0 if successful
135  * \retval              -ENODATA if there is no such xattr
136  * \retval              negative value on error
137  */
138 int ofd_object_ff_load(const struct lu_env *env, struct ofd_object *fo)
139 {
140         struct ofd_thread_info  *info = ofd_info(env);
141         struct filter_fid_old   *ff   = &info->fti_mds_fid_old;
142         struct lu_buf           *buf  = &info->fti_buf;
143         struct lu_fid           *pfid = &fo->ofo_pfid;
144         int                      rc   = 0;
145
146         if (fid_is_sane(pfid))
147                 return 0;
148
149         buf->lb_buf = ff;
150         buf->lb_len = sizeof(*ff);
151         rc = dt_xattr_get(env, ofd_object_child(fo), buf, XATTR_NAME_FID,
152                           BYPASS_CAPA);
153         if (rc < 0)
154                 return rc;
155
156         if (rc < sizeof(struct lu_fid)) {
157                 fid_zero(pfid);
158
159                 return -ENODATA;
160         }
161
162         pfid->f_seq = le64_to_cpu(ff->ff_parent.f_seq);
163         pfid->f_oid = le32_to_cpu(ff->ff_parent.f_oid);
164         pfid->f_stripe_idx = le32_to_cpu(ff->ff_parent.f_stripe_idx);
165
166         return 0;
167 }
168
169 /**
170  * Put OFD object reference.
171  *
172  * \param[in] env       execution environment
173  * \param[in] fo        OFD object
174  */
175 void ofd_object_put(const struct lu_env *env, struct ofd_object *fo)
176 {
177         lu_object_put(env, &fo->ofo_obj.do_lu);
178 }
179
180 /**
181  * Precreate the given number \a nr of objects in the given sequence \a oseq.
182  *
183  * This function precreates new OST objects in the given sequence.
184  * The precreation starts from \a id and creates \a nr objects sequentially.
185  *
186  * Notes:
187  * This function may create fewer objects than requested.
188  *
189  * We mark object SUID+SGID to flag it for accepting UID+GID from client on
190  * first write. Currently the permission bits on the OST are never used,
191  * so this is OK.
192  *
193  * Initialize a/c/m time so any client timestamp will always be newer and
194  * update the inode. The ctime = 0 case is also handled specially in
195  * osd_inode_setattr(). See LU-221, LU-1042 for details.
196  *
197  * \param[in] env       execution environment
198  * \param[in] ofd       OFD device
199  * \param[in] id        object ID to start precreation from
200  * \param[in] oseq      object sequence
201  * \param[in] nr        number of objects to precreate
202  * \param[in] sync      synchronous precreation flag
203  *
204  * \retval              0 if successful
205  * \retval              negative value on error
206  */
207 int ofd_precreate_objects(const struct lu_env *env, struct ofd_device *ofd,
208                           obd_id id, struct ofd_seq *oseq, int nr, int sync)
209 {
210         struct ofd_thread_info  *info = ofd_info(env);
211         struct ofd_object       *fo = NULL;
212         struct dt_object        *next;
213         struct thandle          *th;
214         struct ofd_object       **batch;
215         struct lu_fid           *fid = &info->fti_fid;
216         obd_id                   tmp;
217         int                      rc;
218         int                      i;
219         int                      objects = 0;
220         int                      nr_saved = nr;
221
222         ENTRY;
223
224         /* Don't create objects beyond the valid range for this SEQ */
225         if (unlikely(fid_seq_is_mdt0(ostid_seq(&oseq->os_oi)) &&
226                      (id + nr) >= IDIF_MAX_OID)) {
227                 CERROR("%s:"DOSTID" hit the IDIF_MAX_OID (1<<48)!\n",
228                        ofd_name(ofd), id, ostid_seq(&oseq->os_oi));
229                 RETURN(rc = -ENOSPC);
230         } else if (unlikely(!fid_seq_is_mdt0(ostid_seq(&oseq->os_oi)) &&
231                             (id + nr) >= OBIF_MAX_OID)) {
232                 CERROR("%s:"DOSTID" hit the OBIF_MAX_OID (1<<32)!\n",
233                        ofd_name(ofd), id, ostid_seq(&oseq->os_oi));
234                 RETURN(rc = -ENOSPC);
235         }
236
237         OBD_ALLOC(batch, nr_saved * sizeof(struct ofd_object *));
238         if (batch == NULL)
239                 RETURN(-ENOMEM);
240
241         info->fti_attr.la_valid = LA_TYPE | LA_MODE;
242         info->fti_attr.la_mode = S_IFREG | S_ISUID | S_ISGID | 0666;
243         info->fti_dof.dof_type = dt_mode_to_dft(S_IFREG);
244
245         info->fti_attr.la_valid |= LA_ATIME | LA_MTIME | LA_CTIME;
246         info->fti_attr.la_atime = 0;
247         info->fti_attr.la_mtime = 0;
248         info->fti_attr.la_ctime = 0;
249
250         LASSERT(id != 0);
251
252         /* prepare objects */
253         *fid = *lu_object_fid(&oseq->os_lastid_obj->do_lu);
254         for (i = 0; i < nr; i++) {
255                 rc = fid_set_id(fid, id + i);
256                 if (rc != 0) {
257                         if (i == 0)
258                                 GOTO(out, rc);
259
260                         nr = i;
261                         break;
262                 }
263
264                 fo = ofd_object_find(env, ofd, fid);
265                 if (IS_ERR(fo)) {
266                         if (i == 0)
267                                 GOTO(out, rc = PTR_ERR(fo));
268
269                         nr = i;
270                         break;
271                 }
272
273                 ofd_write_lock(env, fo);
274                 batch[i] = fo;
275         }
276         info->fti_buf.lb_buf = &tmp;
277         info->fti_buf.lb_len = sizeof(tmp);
278         info->fti_off = 0;
279
280         th = ofd_trans_create(env, ofd);
281         if (IS_ERR(th))
282                 GOTO(out, rc = PTR_ERR(th));
283
284         th->th_sync |= sync;
285
286         rc = dt_declare_record_write(env, oseq->os_lastid_obj, &info->fti_buf,
287                                      info->fti_off, th);
288         if (rc)
289                 GOTO(trans_stop, rc);
290
291         for (i = 0; i < nr; i++) {
292                 fo = batch[i];
293                 LASSERT(fo);
294
295                 if (unlikely(ofd_object_exists(fo))) {
296                         /* object may exist being re-created by write replay */
297                         CDEBUG(D_INODE, "object "LPX64"/"LPX64" exists: "
298                                DFID"\n", ostid_seq(&oseq->os_oi), id,
299                                PFID(lu_object_fid(&fo->ofo_obj.do_lu)));
300                         continue;
301                 }
302
303                 next = ofd_object_child(fo);
304                 LASSERT(next != NULL);
305
306                 rc = dt_declare_create(env, next, &info->fti_attr, NULL,
307                                        &info->fti_dof, th);
308                 if (rc < 0) {
309                         if (i == 0)
310                                 GOTO(trans_stop, rc);
311
312                         nr = i;
313                         break;
314                 }
315         }
316
317         rc = dt_trans_start_local(env, ofd->ofd_osd, th);
318         if (rc)
319                 GOTO(trans_stop, rc);
320
321         CDEBUG(D_OTHER, "%s: create new object "DFID" nr %d\n",
322                ofd_name(ofd), PFID(fid), nr);
323
324          /* When the LFSCK scanning the whole device to verify the LAST_ID file
325           * consistency, it will load the last_id into RAM firstly, and compare
326           * the last_id with each OST-object's ID. If the later one is larger,
327           * then it will regard the LAST_ID file crashed. But during the LFSCK
328           * scanning, the OFD may continue to create new OST-objects. Those new
329           * created OST-objects will have larger IDs than the LFSCK known ones.
330           * So from the LFSCK view, it needs to re-load the last_id from disk
331           * file, and if the latest last_id is still smaller than the object's
332           * ID, then the LAST_ID file is real crashed.
333           *
334           * To make above mechanism to work, before OFD pre-create OST-objects,
335           * it needs to update the LAST_ID file firstly, otherwise, the LFSCK
336           * may cannot get latest last_id although new OST-object created. */
337         if (!OBD_FAIL_CHECK(OBD_FAIL_LFSCK_SKIP_LASTID)) {
338                 tmp = cpu_to_le64(id + nr - 1);
339                 dt_write_lock(env, oseq->os_lastid_obj, 0);
340                 rc = dt_record_write(env, oseq->os_lastid_obj,
341                                      &info->fti_buf, &info->fti_off, th);
342                 dt_write_unlock(env, oseq->os_lastid_obj);
343                 if (rc != 0)
344                         GOTO(trans_stop, rc);
345         }
346
347         for (i = 0; i < nr; i++) {
348                 fo = batch[i];
349                 LASSERT(fo);
350
351                 /* Only the new created objects need to be recorded. */
352                 if (ofd->ofd_osd->dd_record_fid_accessed) {
353                         lfsck_pack_rfa(&ofd_info(env)->fti_lr,
354                                        lu_object_fid(&fo->ofo_obj.do_lu));
355                         lfsck_in_notify(env, ofd->ofd_osd,
356                                         &ofd_info(env)->fti_lr);
357                 }
358
359                 if (likely(!ofd_object_exists(fo) &&
360                            !OBD_FAIL_CHECK(OBD_FAIL_LFSCK_DANGLING))) {
361                         next = ofd_object_child(fo);
362                         LASSERT(next != NULL);
363
364                         rc = dt_create(env, next, &info->fti_attr, NULL,
365                                        &info->fti_dof, th);
366                         if (rc < 0) {
367                                 if (i == 0)
368                                         GOTO(trans_stop, rc);
369
370                                 rc = 0;
371                                 break;
372                         }
373                         LASSERT(ofd_object_exists(fo));
374                 }
375                 ofd_seq_last_oid_set(oseq, id + i);
376         }
377
378         objects = i;
379         /* NOT all the wanted objects have been created,
380          * set the LAST_ID as the real created. */
381         if (unlikely(objects < nr)) {
382                 int rc1;
383
384                 info->fti_off = 0;
385                 tmp = cpu_to_le64(ofd_seq_last_oid(oseq));
386                 dt_write_lock(env, oseq->os_lastid_obj, 0);
387                 rc1 = dt_record_write(env, oseq->os_lastid_obj,
388                                       &info->fti_buf, &info->fti_off, th);
389                 dt_write_unlock(env, oseq->os_lastid_obj);
390                 if (rc1 != 0)
391                         CERROR("%s: fail to reset the LAST_ID for seq ("LPX64
392                                ") from "LPU64" to "LPU64"\n", ofd_name(ofd),
393                                ostid_seq(&oseq->os_oi), id + nr - 1,
394                                ofd_seq_last_oid(oseq));
395         }
396
397 trans_stop:
398         ofd_trans_stop(env, ofd, th, rc);
399 out:
400         for (i = 0; i < nr_saved; i++) {
401                 fo = batch[i];
402                 if (fo) {
403                         ofd_write_unlock(env, fo);
404                         ofd_object_put(env, fo);
405                 }
406         }
407         OBD_FREE(batch, nr_saved * sizeof(struct ofd_object *));
408
409         CDEBUG((objects == 0 && rc == 0) ? D_ERROR : D_OTHER,
410                "created %d/%d objects: %d\n", objects, nr_saved, rc);
411
412         LASSERT(ergo(objects == 0, rc < 0));
413         RETURN(objects > 0 ? objects : rc);
414 }
415
416 /**
417  * Fix the OFD object ownership.
418  *
419  * If the object still has SUID+SGID bits set, meaning that it was precreated
420  * by the MDT before it was assigned to any file, (see ofd_precreate_objects())
421  * then we will accept the UID+GID if sent by the client for initializing the
422  * ownership of this object.  We only allow this to happen once (so clear these
423  * bits) and later only allow setattr.
424  *
425  * \param[in] env        execution environment
426  * \param[in] fo         OFD object
427  * \param[in] la         object attributes
428  * \param[in] is_setattr was this function called from setattr or not
429  *
430  * \retval              0 if successful
431  * \retval              negative value on error
432  */
433 int ofd_attr_handle_ugid(const struct lu_env *env, struct ofd_object *fo,
434                          struct lu_attr *la, int is_setattr)
435 {
436         struct ofd_thread_info  *info = ofd_info(env);
437         struct lu_attr          *ln = &info->fti_attr2;
438         __u32                    mask = 0;
439         int                      rc;
440
441         ENTRY;
442
443         if (!(la->la_valid & LA_UID) && !(la->la_valid & LA_GID))
444                 RETURN(0);
445
446         rc = dt_attr_get(env, ofd_object_child(fo), ln, BYPASS_CAPA);
447         if (rc != 0)
448                 RETURN(rc);
449
450         LASSERT(ln->la_valid & LA_MODE);
451
452         if (!is_setattr) {
453                 if (!(ln->la_mode & S_ISUID))
454                         la->la_valid &= ~LA_UID;
455                 if (!(ln->la_mode & S_ISGID))
456                         la->la_valid &= ~LA_GID;
457         }
458
459         if ((la->la_valid & LA_UID) && (ln->la_mode & S_ISUID))
460                 mask |= S_ISUID;
461         if ((la->la_valid & LA_GID) && (ln->la_mode & S_ISGID))
462                 mask |= S_ISGID;
463         if (mask != 0) {
464                 if (!(la->la_valid & LA_MODE) || !is_setattr) {
465                         la->la_mode = ln->la_mode;
466                         la->la_valid |= LA_MODE;
467                 }
468                 la->la_mode &= ~mask;
469         }
470
471         RETURN(0);
472 }
473
474 /**
475  * Set OFD object attributes.
476  *
477  * This function sets OFD object attributes taken from incoming request.
478  * It sets not only regular attributes but also XATTR_NAME_FID extended
479  * attribute if needed. The "fid" xattr allows the object's MDT parent inode
480  * to be found and verified by LFSCK and other tools in case of inconsistency.
481  *
482  * \param[in] env       execution environment
483  * \param[in] fo        OFD object
484  * \param[in] la        object attributes
485  * \param[in] ff        filter_fid structure, contains additional attributes
486  *
487  * \retval              0 if successful
488  * \retval              negative value on error
489  */
490 int ofd_attr_set(const struct lu_env *env, struct ofd_object *fo,
491                  struct lu_attr *la, struct filter_fid *ff)
492 {
493         struct ofd_thread_info  *info = ofd_info(env);
494         struct ofd_device       *ofd = ofd_obj2dev(fo);
495         struct thandle          *th;
496         struct ofd_mod_data     *fmd;
497         int                      ff_needed = 0;
498         int                      rc;
499         ENTRY;
500
501         ofd_write_lock(env, fo);
502         if (!ofd_object_exists(fo))
503                 GOTO(unlock, rc = -ENOENT);
504
505         if (la->la_valid & (LA_ATIME | LA_MTIME | LA_CTIME)) {
506                 fmd = ofd_fmd_get(info->fti_exp, &fo->ofo_header.loh_fid);
507                 if (fmd && fmd->fmd_mactime_xid < info->fti_xid)
508                         fmd->fmd_mactime_xid = info->fti_xid;
509                 ofd_fmd_put(info->fti_exp, fmd);
510         }
511
512         /* VBR: version recovery check */
513         rc = ofd_version_get_check(info, fo);
514         if (rc)
515                 GOTO(unlock, rc);
516
517         rc = ofd_attr_handle_ugid(env, fo, la, 1 /* is_setattr */);
518         if (rc != 0)
519                 GOTO(unlock, rc);
520
521         if (ff != NULL) {
522                 rc = ofd_object_ff_load(env, fo);
523                 if (rc == -ENODATA)
524                         ff_needed = 1;
525                 else if (rc < 0)
526                         GOTO(unlock, rc);
527         }
528
529         th = ofd_trans_create(env, ofd);
530         if (IS_ERR(th))
531                 GOTO(unlock, rc = PTR_ERR(th));
532
533         rc = dt_declare_attr_set(env, ofd_object_child(fo), la, th);
534         if (rc)
535                 GOTO(stop, rc);
536
537         if (ff_needed) {
538                 info->fti_buf.lb_buf = ff;
539                 info->fti_buf.lb_len = sizeof(*ff);
540                 rc = dt_declare_xattr_set(env, ofd_object_child(fo),
541                                           &info->fti_buf, XATTR_NAME_FID, 0,
542                                           th);
543                 if (rc)
544                         GOTO(stop, rc);
545         }
546
547         rc = ofd_trans_start(env, ofd, la->la_valid & LA_SIZE ? fo : NULL, th);
548         if (rc)
549                 GOTO(stop, rc);
550
551         rc = dt_attr_set(env, ofd_object_child(fo), la, th,
552                          ofd_object_capa(env, fo));
553         if (rc)
554                 GOTO(stop, rc);
555
556         if (ff_needed) {
557                 rc = dt_xattr_set(env, ofd_object_child(fo), &info->fti_buf,
558                                   XATTR_NAME_FID, 0, th, BYPASS_CAPA);
559                 if (rc == 0) {
560                         fo->ofo_pfid.f_seq = le64_to_cpu(ff->ff_parent.f_seq);
561                         fo->ofo_pfid.f_oid = le32_to_cpu(ff->ff_parent.f_oid);
562                         /* Currently, the filter_fid::ff_parent::f_ver is not
563                          * the real parent MDT-object's FID::f_ver, instead it
564                          * is the OST-object index in its parent MDT-object's
565                          * layout EA. */
566                         fo->ofo_pfid.f_stripe_idx =
567                                         le32_to_cpu(ff->ff_parent.f_stripe_idx);
568                 }
569         }
570
571         GOTO(stop, rc);
572
573 stop:
574         ofd_trans_stop(env, ofd, th, rc);
575 unlock:
576         ofd_write_unlock(env, fo);
577
578         return rc;
579 }
580
581 /**
582  * Truncate/punch OFD object.
583  *
584  * This function frees all of the allocated object's space from the \a start
585  * offset to the \a end offset. For truncate() operations the \a end offset
586  * is OBD_OBJECT_EOF. The functionality to punch holes in an object via
587  * fallocate(FALLOC_FL_PUNCH_HOLE) is not yet implemented (see LU-3606).
588  *
589  * \param[in] env       execution environment
590  * \param[in] fo        OFD object
591  * \param[in] start     start offset to punch from
592  * \param[in] end       end of punch
593  * \param[in] la        object attributes
594  * \param[in] ff        filter_fid structure
595  * \param[in] oa        obdo struct from incoming request
596  *
597  * \retval              0 if successful
598  * \retval              negative value on error
599  */
600 int ofd_object_punch(const struct lu_env *env, struct ofd_object *fo,
601                      __u64 start, __u64 end, struct lu_attr *la,
602                      struct filter_fid *ff, struct obdo *oa)
603 {
604         struct ofd_thread_info  *info = ofd_info(env);
605         struct ofd_device       *ofd = ofd_obj2dev(fo);
606         struct ofd_mod_data     *fmd;
607         struct dt_object        *dob = ofd_object_child(fo);
608         struct thandle          *th;
609         int                      ff_needed = 0;
610         int                      rc;
611
612         ENTRY;
613
614         /* we support truncate, not punch yet */
615         LASSERT(end == OBD_OBJECT_EOF);
616
617         fmd = ofd_fmd_get(info->fti_exp, &fo->ofo_header.loh_fid);
618         if (fmd && fmd->fmd_mactime_xid < info->fti_xid)
619                 fmd->fmd_mactime_xid = info->fti_xid;
620         ofd_fmd_put(info->fti_exp, fmd);
621
622         ofd_write_lock(env, fo);
623         if (!ofd_object_exists(fo))
624                 GOTO(unlock, rc = -ENOENT);
625
626         if (ofd->ofd_lfsck_verify_pfid && oa->o_valid & OBD_MD_FLFID) {
627                 rc = ofd_verify_ff(env, fo, oa);
628                 if (rc != 0)
629                         GOTO(unlock, rc);
630         }
631
632         /* VBR: version recovery check */
633         rc = ofd_version_get_check(info, fo);
634         if (rc)
635                 GOTO(unlock, rc);
636
637         rc = ofd_attr_handle_ugid(env, fo, la, 0 /* !is_setattr */);
638         if (rc != 0)
639                 GOTO(unlock, rc);
640
641         if (ff != NULL) {
642                 rc = ofd_object_ff_load(env, fo);
643                 if (rc == -ENODATA)
644                         ff_needed = 1;
645                 else if (rc < 0)
646                         GOTO(unlock, rc);
647         }
648
649         th = ofd_trans_create(env, ofd);
650         if (IS_ERR(th))
651                 GOTO(unlock, rc = PTR_ERR(th));
652
653         rc = dt_declare_attr_set(env, dob, la, th);
654         if (rc)
655                 GOTO(stop, rc);
656
657         rc = dt_declare_punch(env, dob, start, OBD_OBJECT_EOF, th);
658         if (rc)
659                 GOTO(stop, rc);
660
661         if (ff_needed) {
662                 info->fti_buf.lb_buf = ff;
663                 info->fti_buf.lb_len = sizeof(*ff);
664                 rc = dt_declare_xattr_set(env, ofd_object_child(fo),
665                                           &info->fti_buf, XATTR_NAME_FID, 0,
666                                           th);
667                 if (rc)
668                         GOTO(stop, rc);
669         }
670
671         rc = ofd_trans_start(env, ofd, fo, th);
672         if (rc)
673                 GOTO(stop, rc);
674
675         rc = dt_punch(env, dob, start, OBD_OBJECT_EOF, th,
676                       ofd_object_capa(env, fo));
677         if (rc)
678                 GOTO(stop, rc);
679
680         rc = dt_attr_set(env, dob, la, th, ofd_object_capa(env, fo));
681         if (rc)
682                 GOTO(stop, rc);
683
684         if (ff_needed) {
685                 rc = dt_xattr_set(env, ofd_object_child(fo), &info->fti_buf,
686                                   XATTR_NAME_FID, 0, th, BYPASS_CAPA);
687                 if (rc == 0) {
688                         fo->ofo_pfid.f_seq = le64_to_cpu(ff->ff_parent.f_seq);
689                         fo->ofo_pfid.f_oid = le32_to_cpu(ff->ff_parent.f_oid);
690                         /* Currently, the filter_fid::ff_parent::f_ver is not
691                          * the real parent MDT-object's FID::f_ver, instead it
692                          * is the OST-object index in its parent MDT-object's
693                          * layout EA. */
694                         fo->ofo_pfid.f_stripe_idx =
695                                         le32_to_cpu(ff->ff_parent.f_stripe_idx);
696                 }
697         }
698
699         GOTO(stop, rc);
700
701 stop:
702         ofd_trans_stop(env, ofd, th, rc);
703 unlock:
704         ofd_write_unlock(env, fo);
705
706         return rc;
707 }
708
709 /**
710  * Destroy OFD object.
711  *
712  * This function destroys OFD object. If object wasn't used at all (orphan)
713  * then local transaction is used, which means the transaction data is not
714  * returned back in reply.
715  *
716  * \param[in] env       execution environment
717  * \param[in] fo        OFD object
718  * \param[in] orphan    flag to indicate that object is orphaned
719  *
720  * \retval              0 if successful
721  * \retval              negative value on error
722  */
723 int ofd_object_destroy(const struct lu_env *env, struct ofd_object *fo,
724                        int orphan)
725 {
726         struct ofd_device       *ofd = ofd_obj2dev(fo);
727         struct thandle          *th;
728         int                      rc = 0;
729
730         ENTRY;
731
732         ofd_write_lock(env, fo);
733         if (!ofd_object_exists(fo))
734                 GOTO(unlock, rc = -ENOENT);
735
736         th = ofd_trans_create(env, ofd);
737         if (IS_ERR(th))
738                 GOTO(unlock, rc = PTR_ERR(th));
739
740         dt_declare_ref_del(env, ofd_object_child(fo), th);
741         dt_declare_destroy(env, ofd_object_child(fo), th);
742         if (orphan)
743                 rc = dt_trans_start_local(env, ofd->ofd_osd, th);
744         else
745                 rc = ofd_trans_start(env, ofd, NULL, th);
746         if (rc)
747                 GOTO(stop, rc);
748
749         ofd_fmd_drop(ofd_info(env)->fti_exp, &fo->ofo_header.loh_fid);
750
751         dt_ref_del(env, ofd_object_child(fo), th);
752         dt_destroy(env, ofd_object_child(fo), th);
753 stop:
754         ofd_trans_stop(env, ofd, th, rc);
755 unlock:
756         ofd_write_unlock(env, fo);
757         RETURN(rc);
758 }
759
760 /**
761  * Get OFD object attributes.
762  *
763  * This function gets OFD object regular attributes. It is used to serve
764  * incoming request as well as for local OFD purposes.
765  *
766  * \param[in] env       execution environment
767  * \param[in] fo        OFD object
768  * \param[in] la        object attributes
769  *
770  * \retval              0 if successful
771  * \retval              negative value on error
772  */
773 int ofd_attr_get(const struct lu_env *env, struct ofd_object *fo,
774                  struct lu_attr *la)
775 {
776         int rc = 0;
777
778         ENTRY;
779
780         if (ofd_object_exists(fo)) {
781                 rc = dt_attr_get(env, ofd_object_child(fo), la,
782                                  ofd_object_capa(env, fo));
783
784 #if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(2, 7, 53, 0)
785                 /* Try to correct for a bug in 2.1.0 (LU-221) that caused
786                  * negative timestamps to appear to be in the far future,
787                  * due old timestamp being stored on disk as an unsigned value.
788                  * This fixes up any bad values stored on disk before
789                  * returning them to the client, and ensures any timestamp
790                  * updates are correct.  LU-1042 */
791                 if (unlikely(la->la_atime == LU221_BAD_TIME))
792                         la->la_atime = 0;
793                 if (unlikely(la->la_mtime == LU221_BAD_TIME))
794                         la->la_mtime = 0;
795                 if (unlikely(la->la_ctime == LU221_BAD_TIME))
796                         la->la_ctime = 0;
797 #endif
798         } else {
799                 rc = -ENOENT;
800         }
801         RETURN(rc);
802 }